EDIT: la versione originale ha perso un valore assoluto. spiacente!!
Ciao Ian Descriverò brevemente due disuguaglianze di esempio, una usando un limite di Lipschitz, l'altra usando un limite sul secondo derivato, e poi discuterò alcune difficoltà in questo problema. Sebbene io sia ridondante, poiché un approccio che utilizza un derivato spiega cosa succede con più derivati (tramite Taylor), risulta che la seconda versione derivata è piuttosto carina.
Innanzitutto, con un limite di Lipschitz: rielaborare semplicemente la disuguaglianza standard di Jensen. Lo stesso trucco si applica: calcolare l'espansione di Taylor al valore atteso.
In particolare, Sia misura corrispondente e imposta . Se ha la costante Lipschitz , allora secondo il teorema di Taylorμ m : = E ( x ) f LXμm:=E(x)fL
f(x)=f(m)+f′(z)(x−m)≤f(m)+L|x−m|,
dove (si noti che e sono possibili). Usando questo e rielaborando la prova di Jensen (sono paranoico e ho verificato che quello standard sia effettivamente su Wikipedia),x ≤ m x > mz∈[m,x]x≤mx>m
E(f(X))=∫f(x)dμ(x)≤f(m)∫dμ(x)+L∫|x−m|dμ(x)=f(E(X))+LE(|X−E(X)|).
Supponiamo ora . In questo caso,|f′′(x)|≤λ
f(x)=f(m)+f′(m)(x−m)+f′′(z)(x−m)22≤f(m)+f′(m)(x−m)+λ(x−m)22,
e così
E(f(X))≤f(m)+f′(m)(E(X)−m)+λE((X−m)2)2=f(E(X))+λVar(X)2.
Vorrei menzionare brevemente alcune cose. Scusa se sono ovvi.
Uno è che non puoi semplicemente dire "wlog " spostando la distribuzione, perché stai cambiando la relazione tra e .f μE(X)=0fμ
Il prossimo è che il limite deve dipendere in qualche modo dalla distribuzione. Per vedere questo, immaginare che e . Qualunque sia il valore di , ottieni comunque . D'altra parte, . Quindi, cambiando , puoi rendere arbitrario il divario tra le due quantità! Intuitivamente, più massa viene allontanata dalla media e quindi, per qualsiasi funzione strettamente convessa, aumenterà .f ( x ) = x 2 σ f ( E ( X ) ) = f ( 0 ) = 0 E ( f ( X ) ) = E ( X 2 ) = σ 2 σ E ( f ( X ) )X∼Gaussian(0,σ2)f(x)=x2σf(E(X))=f(0)=0E(f(X))=E(X2)=σ2σE(f(X))
Infine, non vedo come ottenere un limite moltiplicativo come suggerisci tu. Tutto ciò che ho usato in questo post è standard: il teorema di Taylor e i limiti dei derivati sono pane e burro nei limiti delle statistiche e danno automaticamente errori additivi, non moltiplicativi.
Ci penserò e pubblicherò qualcosa. La vaga intuizione è che avrà bisogno di condizioni molto faticose sia per la funzione che per la distribuzione e che il limite additivo è effettivamente al centro di esso.