Limite esponenziale superiore


12

Supponiamo di avere variabili casuali IID X1,,Xn con distribuzione Ber(θ) . Stiamo andando a osservare un campione della Xi 's nel seguente modo: lasciamo Y1,,Yn essere indipendenti Ber(1/2) variabili casuali, si supponga che tutte le Xi ' s e Yi sono indipendenti e definiscono la dimensione del campione N=i=1nYi. LeYiindicano quali delleXisono nel campione e vogliamo studiare la frazione di successi nel campione definita da

Z={1Ni=1nXiYiifN>0,0ifN=0.
Perϵ>0, vogliamo trovare un limite superiore perPr(Zθ+ϵ) che decade in modo esponenziale conn . La disuguaglianza di Hoeffding non si applica immediatamente a causa delle dipendenze tra le variabili.

1
Sia . (i) non èZiindipendenteZji? (ii) non èZ=Zi? ... Di conseguenza, non mi è chiaro cheZnon sia "una somma di variabili casuali indipendenti"Zi=1NXiYiZiZjiZ=ZiZ
Glen_b -Reinstate Monica

Ah, buon punto. Stavo pensando a , piuttosto che N . Ma non puoi invece scrivere Z i = 1nNe lasciareZ= n i = 1 Zi? Cioè, sommare tutti i casi, indipendentemente dal fatto cheYsia 1 o 0. ... no che non funziona. Il numeratore è lo stesso ma il denominatore è diverso. Zi=1nXiYiZ=i=1nZiY
Glen_b

Questo dà meno della frazione di successi nel campione, che è la quantità di interesse per il problema, perché , poiché n n . (1/n)i=1nXiYi(1/N)i=1nXiYiNn
Zen,

1
Sì, è per questo che ho finito con "no che non funziona". Ci sono disuguaglianze che si applicano al caso non indipendente, come alcune delle disuguaglianze di Bernstein (vedi il quarto punto), e ci sono una serie di disuguaglianze che si applicano alle martingala (anche se non so che quelle si applicheranno qui).
Glen_b -Restate Monica

1
Darò un'occhiata e cercherò anche di trovare una connessione con i risultati delle martingala. Il limite per è così semplice ( P r ( U θ / 2 + ϵ ) exp ( - 2 n ϵ 2 ) ) che è allettante connetterlo con Z che usa un qualche tipo di condizionamento. U=(1/n)i=1nXiYiPr(Uθ/2+ϵ)exp(2nϵ2)Z
Zen,

Risposte:


16

Possiamo stabilire una connessione con la disuguaglianza di Hoeffding in modo abbastanza diretto .

Nota che abbiamo

{Z>θ+ϵ}={iXiYi>(θ+ϵ)iYi}={i(Xiθϵ)Yi>0}.

Impostare modo che Z i sia iid, E Z i = 0 e P ( Z > θ + ϵ ) = P ( i Z i > n ϵ / 2 )e - n ε 2 / 2Zi=(Xiθϵ)Yi+ϵ/2ZiEZi=0 mediante una semplice applicazione delladisuguaglianzadiHoeffding(dal momento che Z i[ - θ - ϵ / 2 , 1 - θ - ϵ / 2 ] e quindi prendere valori in un intervallo di dimensioni uno).

P(Z>θ+ϵ)=P(iZi>nϵ/2)enϵ2/2,
Zi[θϵ/2,1θϵ/2]

C'è una letteratura correlata ricca e affascinante che si è sviluppata negli ultimi anni, in particolare, su argomenti relativi alla teoria delle matrici casuali con varie applicazioni pratiche. Se sei interessato a questo genere di cose, ti consiglio vivamente:

R. Vershynin, Introduzione all'analisi non asintotica di matrici casuali , Capitolo 5 di Compressed Sensing, Theory and Applications. A cura di Y. Eldar e G. Kutyniok. Cambridge University Press, 2012.

Penso che l'esposizione sia chiara e fornisca un modo molto carino per abituarsi rapidamente alla letteratura.


1
Dal momento che la includono ε / 2 nella loro definizione, ho l'impressione che Z i[ - θ - ε / 2 , 1 - θ - ε / 2 ] (il limite non cambia). Ziϵ/2Zi[θϵ/2,1θϵ/2]
Alecos Papadopoulos,

1
Caro @Zen: Nota che un'attenta contabilità del caso ti permetterà di sostituire la disuguaglianza rigorosa > con ovunque senza cambiare il limite finale. N=0>
cardinale il

Caro @cardinale: ho riformulato la domanda perché in realtà è uno stimatore (leggermente) distorto di θ , poiché E [ Z ] = E [ I { N = 0 } Z ] + E [ I { N > 0 } Z ] = ( 1 - 1 / 2 n )Zθ . E[Z]=E[I{N=0}Z]+E[I{N>0}Z]=(11/2n)θ
Zen,

6

Dettagli per occuparsi del caso . N=0

{Zθ+ϵ}=({Zθ+ϵ}{N=0})({Zθ+ϵ}{N>0})=({0θ+ϵ}{N=0})({Zθ+ϵ}{N>0})=({N=0})({Zθ+ϵ}{N>0})={i=1nXiYi(θ+ϵ)i=1nYi}{N>0}{i=1nXiYi(θ+ϵ)i=1nYi}={i=1n(Xiθϵ)Yi0}={i=1n((Xiθϵ)Yi+ϵ/2)nϵ/2}.

Per Alecos.

E[i=1nWi]=E[I{i=1nYi=0}i=1nWi]+E[I{i=1nYi>0}i=1nWi]=E[I{i=1nYi>0}i=1nYii=1nYi]=E[I{i=1nYi>0}]=11/2n.

5

Questa risposta continua a mutare. La versione attuale non si riferisce alla discussione che ho avuto con @cardinal nei commenti (anche se è stata attraverso questa discussione che per fortuna ho capito che l'approccio del condizionamento non sembrava condurre da nessuna parte).

Per questo tentativo, userò un'altra parte del documento originale di Hoeffding del 1963 , vale a dire la sezione 5 "Somma delle variabili casuali dipendenti".

WiYii=1nYi,i=1nYi0,i=1nWi=1,n2

Wi=0i=1nYi=0

Quindi abbiamo la variabile

Zn=i=1nWiXi,E(Zn)μn

Siamo interessati alla probabilità

Pr(Znμn+ϵ),ϵ<1μn

Pr(Znμn+ϵ)=E[1{Znμnϵ0}]

1{Znμnϵ0}exp{h(Znμnϵ)},h>0

i=1nWi=1

ehZn=exp{h(i=1nWiXi)}i=1nWiehXi

e collegando i risultati a cui arrivare

Pr(Znμn+ϵ)eh(μn+ϵ)E[i=1nWiehXi]

WiXi

Pr(Znμn+ϵ)eh(μn+ϵ)i=1nE(Wi)E(ehXi)

XiθE[ehXi]hE[ehXi]=1θ+θeh

Pr(Znμn+ϵ)eh(μn+ϵ)(1θ+θeh)i=1nE(Wi)

h

eh=(1θ)(μn+ϵ)θ(1μnϵ)

Inserendolo nella disuguaglianza e manipolando otteniamo

Pr(Znμn+ϵ)(θμn+ϵ)μn+ϵ(1θ1μnϵ)1μnϵi=1nE(Wi)

mentre

Pr(Znθ+ϵ)(θθ+ϵ)θ+ϵ(1θ1θϵ)1θϵi=1nE(Wi)

Hoeffding lo dimostra

(θθ+ϵ)θ+ϵ(1θ1θϵ)1θϵe2ϵ2

i=1nE(Wi)=11/2n

Pr(Znθ+ϵ)(112n)e2ϵ2BD

BI

BD=(112n)e2ϵ2enϵ2/2=BI

2n12nexp{(4n2)ϵ2}

n4BDBIn5BIBDϵn=12ε0.008Bio


WioXioXio


E[W1]=(1-1/2n)/nn

@Zen In effetti (in effetti aumenta con la dimensione del campione, anche se in modo limitato), ecco perché il limite di Cardinal è più utile per la maggior parte delle dimensioni del campione.
Alecos Papadopoulos,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.