Comprendere la prova di un lemma usato nella disuguaglianza di Hoeffding


11

Sto studiando gli appunti di Larry Wasserman su Statistica che usa Casella e Berger come testo principale. Sto lavorando al suo set di note 2 e sono rimasto bloccato nella derivazione del lemma usato nella disuguaglianza di Hoeffding (pagg. 2-3). Sto riproducendo la prova nelle note sottostanti e dopo la prova indicherò dove sono bloccato.


Lemma

Supponiamo che e che . Quindi .E(X)=0aXbE(etX)et2(ba)2/8

Prova

Poiché , possiamo scrivere come combinazione convessa di e , cioè cui . Per convessità della funzione abbiamoaXbXabX=αb+(1α)aα=Xabayety

etXαetb+(1α)eta=Xabaetb+bXbaeta

Prendi le aspettative di entrambe le parti e usa il fatto per ottenereE(X)=0

E(etX)abaetb+bbaeta=eg(u)

dove , e . Nota che . Inoltre per tutti u> 0 .g ( u ) = - γ u + log ( 1 - γ + γ e u ) γ = - a / ( b - a ) g ( 0 ) = gu=t(ba)g(u)=γu+log(1γ+γeu)γ=a/(ba)gg(0)=g(0)=0g(u)1/4u>0

Secondo il teorema di Taylor, esiste un ε(0,u) tale che g(u)=g(0)+ug(0)+u22g(ε)=u22g(ε)u28=t2(ba)28

Quindi E(etX)eg(u)et2(ba)28 .


Potrei seguire la prova fino a

u,g(u),γE(etX)abaetb+bbaeta=eg(u) ma non sono in grado di capire come derivare .u,g(u),γ


3
È interessante che il valore massimo di sia e quindi il risultato sia effettivamente che sembra troppo familiare per derivare da una pura coincidenza. Sospetto che ci possa essere un altro modo, forse più semplice, per ricavare il risultato attraverso un argomento probabilistico. var(X)σmax2=(ba)2/4
E[etX]eσmax2t2/2
Dilip Sarwate,

@DilipSarwate La mia comprensione è che la varianza massima si verifica per una variabile casuale uniforme . La varianza di è . Puoi spiegare come hai ottenuto ? X V a r ( X ) = ( b - a ) 2XU(a,b)X (b-a)2Var(X)=(ba)212(ba)24
Anand,

Concentrando la massa sugli endpoint ...
Elvis

@DilipSarwate Ho aggiunto alcuni commenti nella dimostrazione, il che potrebbe chiarire un po 'il motivo per cui il caso peggiore è la varianza massima.
Elvis,

1
@DilipSarwate - Vedi il lemma 1 ed esercizio 1 qui: terrytao.wordpress.com/2010/01/03/… . Sembra che ci sia una derivazione più semplice basandosi sulla disuguaglianza di Jensen e sull'espansione di Taylor. Tuttavia i dettagli di questo non sono chiari per me. Forse qualcuno può capirlo. (derivazione da (9) a (10) ed esercizio 1)
Leone

Risposte:


17

Non sono sicuro di aver capito bene la tua domanda. Proverò a rispondere: prova a scrivere in funzione di : questo è naturale come vuoi un limite in .u=t(b-a)e u 2

abaetb+bbaeta
u=t(ba)eu28

Aiutato dall'esperienza, saprai che è meglio scegliere di scriverlo nel modulo . Quindi porta a con . e g ( u ) = - aeg(u) g ( u )

eg(u)=abaetb+bbaeta
γ=-a
g(u)=log(abaetb+bbaeta)=log(eta(abaet(ba)+bba))=ta+log(γeu+(1γ))=γu+log(γeu+(1γ)),
γ=aba

È questo il tipo di cosa che stavi chiedendo?

Modifica: alcuni commenti sulla prova

  1. Il primo trucco merita di essere esaminato attentamente: se è una funzione convessa e è una variabile casuale centrata, allora dove è la variabile discreta definita da Di conseguenza, ottieni che è la variabile centrata con supporto in che presenta la varianza più alta: Si noti che se si corregge una larghezza di supportoa X b E ( ϕ ( X ) ) - aϕaXbX 0 P ( X 0 = a )
    E(ϕ(X))abaϕ(b)+bbaϕ(a)=E(ϕ(X0)),
    X0X0[a
    P(X0=a)=bbaP(X0=b)=aba.
    X0V a r ( X ) = E ( X 2 ) E ( X 2 0 ) = b a 2 - a b 2[a,b](b-a)(b-a)2
    Var(X)=E(X2)E(X02)=ba2ab2ba=ab.
    (ba), questo è inferiore a come dice Dilip nei commenti, questo perché ; il limite è raggiunto per .(ba)24(ba)2+4ab0a=b
  2. Ora passa al nostro problema. Perché è possibile ottenere un limite dipendente solo da ? Intuitivamente, si tratta solo di riscalare : se hai un limite per il caso , allora il limite generale può essere ottenuto prendendo . Ora pensa all'insieme di variabili centrate con supporto di larghezza 1: non c'è tanta libertà, quindi dovrebbe esistere un limite come . Un altro approccio è quello di dire semplicemente che dal precedente lemma su , quindi più in generale , che dipende solo da eX E ( e t X )s ( t ) b - a = 1 s ( t )u=t(ba)XE(etX)s(t)ba=1s(t(ba))s(t)

    E(ϕ(X))E(ϕ(tX))E(ϕ(tX0))uγ : se e e lasci che vari, c'è solo un grado di libertà, e , , . Otteniamo Non vi resta che trovare un legato che coinvolge solo .u=u0=t0(b0a0)γ=γ0=a0b0a0t,a,bt=t0αa=αa0b=αa0

    abaϕ(tb)+bbaϕ(ta)=a0b0a0ϕ(tb0)+b0b0a0ϕ(a0).
    u
  3. Ora siamo convinti che possa essere fatto, deve essere molto più semplice! Per cominciare, non devi necessariamente pensare a . Il punto è che devi scrivere tutto in funzione di e . Prima nota che , , e . Quindi Ora siamo nel caso particolare ... I pensa di poter finire.guγ

    γ=aba1γ=bbaat=γubt=(1γ)u

    E(ϕ(tX))abaϕ(tb)+bbaϕ(ta)=γϕ((1γ)u)+(1γ)ϕ(γu)


    ϕ=exp

Spero di averlo chiarito un po '.


questo è esattamente quello che stavo cercando. Molte grazie.
Anand,

1
@Anand so che è un consiglio difficile da seguire, tuttavia penso che non dovresti iniziare concentrandoti sui dettagli tecnici, ma piuttosto cercare di capire perché un tale limite possa esistere ... quindi la prova dovrebbe apparire più facile. Ho provato a mostrarti il perché nella seconda parte, aggiunto stamattina (devi dormire su una domanda come questa - almeno devo farlo). Penso che sia terribile come questo tipo di intuizioni non appaia nella maggior parte dei libri di testo ... anche se ottieni la parte tecnica, purché tu non abbia le idee tutto sembra magico. Grazie e CrossV per avermi dato l'opportunità di pensarci in dettaglio!
Elvis,

1
Wow! +1 per la modifica. Grazie. Ma non sarebbe bello se fosse possibile ottenere qualcosa come
E[etX]eE[t2X2/2]=e(t2/2)E[X2]=e(t2/2)var(X)et2σmax2/2?
Dilip Sarwate,

@Elvis Grazie per il consiglio e per aver dedicato del tempo a scrivere la parte intuitiva. Ho bisogno di passare un po 'di tempo per capirlo!
Anand,

1
@Elvis Considerando l'intuizione, voglio chiarire la mia comprensione. Per ottenere limiti più nitidi è necessario un momento più elevato. Markov usa il primo momento, Chebyshev il secondo momento e Hoeffding usa mgf. È corretto? Se qualcuno può espandere e chiarire questa parte, sarebbe fantastico.
Anand,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.