Come capire che MLE of Variance è distorto in una distribuzione gaussiana?


12

Illustrazione del PRML di come nasce il pregiudizio nell'usare la massima probabilità per determinare la varianza di un gaussiano

Sto leggendo PRML e non capisco l'immagine. Potresti dare qualche suggerimento per capire il quadro e perché l'MLE della varianza in una distribuzione gaussiana è distorta?

formula 1.55: formula 1.56

μMLE=1Nn=1Nxn
σMLE2=1Nn=1N(xnμMLE)2

Aggiungi il tag di studio autonomo.
StatStudent

2
perché per ogni grafico è visibile solo un punto dati blu? a proposito, mentre stavo cercando di modificare l'overflow di due pedici in questo post, il sistema richiede "almeno 6 caratteri" ... imbarazzante.
Zhanxiong,

Cosa vuoi veramente capire, l'immagine o perché la stima MLE della varianza è distorta? Il primo è molto confuso, ma posso spiegare il secondo.
TrynnaDoStat,

sì, ho trovato nella nuova versione ogni grafico ha due dati blu, il mio pdf è vecchio
ningyuwhut

@ TrynnaDoStat mi dispiace per la mia domanda non è chiara. quello che voglio sapere è perché la stima MLE della varianza è parziale. e come questo è espresso in questo grafico
ningyuwhut,

Risposte:


25

Intuizione

La tendenza è "proveniente da" (per niente un termine tecnico) il fatto che è distorto per . La domanda naturale è: "beh, qual è l'intuizione del perché è distorto per "? L'intuizione è che in una media campionaria non quadrata, a volte ci manca il vero valore sopravvalutando e talvolta sottostimando. Ma, senza quadrare, la tendenza a sopravvalutare e sottostimare si annullerà a vicenda. Tuttavia, quando quadriamo la tendenza a sottovalutare (manca il vero valore diE[x¯2]μ2E[x¯2]μ2μx¯μda un numero negativo) diventa anche quadrato e diventa quindi positivo. Pertanto, non si cancella più e c'è una leggera tendenza a sopravvalutare.

Se l'intuizione dietro perché è distorta per è ancora chiara, prova a capire l'intuizione dietro la disuguaglianza di Jensen (una buona spiegazione intuitiva qui ) e applicala a .x2μ2E[x2]

Dimostriamo che l'MLE della varianza per un campione iid è distorto. Quindi verificheremo analiticamente la nostra intuizione.

Prova

Lascia che .σ^2=1Nn=1N(xnx¯)2

Vogliamo mostrare .E[σ^2]σ2

E[σ^2]=E[1Nn=1N(xnx¯)2]=1NE[n=1N(xn22xnx¯+x¯2)]=1NE[n=1Nxn2n=1N2xnx¯+n=1Nx¯2]

Usando il fatto che e ,n=1Nxn=Nx¯n=1Nx¯2=Nx¯2

1NE[n=1Nxn2n=1N2xnx¯+n=1Nx¯2]=1NE[n=1Nxn22Nx¯2+Nx¯2]=1NE[n=1Nxn2Nx¯2]=1NE[n=1Nxn2]E[x¯2]=1Nn=1NE[xn2]E[x¯2]=E[xn2]E[x¯2]

Con l'ultimo passaggio che segue, dato che è uguale su causa della stessa distribuzione.E[xn2]n

Ora, ricorda la definizione di varianza che dice . Da qui, otteniamo quanto segueσx2=E[x2]E[x]2

E[xn2]E[x¯2]=σx2+E[xn]2σx¯2E[xn]2=σx2σx¯2=σx2Var(x¯)=σx2Var(1Nn=1Nxn)=σx2(1N)2Var(n=1Nxn)

Si noti che abbiamo eliminato adeguatamente la costante quando la estraiamo da . Presta particolare attenzione a questo!1NVar()

σx2(1N)2Var(n=1Nxn)=σx2(1N)2Nσx2=σx21Nσx2=N1Nσx2

che ovviamente non è uguale a .σx2

Verifica analiticamente la nostra intuizione

Possiamo in qualche modo verificare l'intuizione assumendo di conoscere il valore di e collegandolo alla dimostrazione di cui sopra. Dato che ora conosciamo , non abbiamo più la necessità di stimare e quindi non lo sopravvalutiamo mai con . Vediamo che questo "rimuove" il bias in .μμμ2E[x¯2]σ^2

Lascia che .σ^μ2=1Nn=1N(xnμ)2

Dalla prova precedente, prendiamo da sostituendo con il valore reale .ˉ x μE[xn2]E[x¯2]x¯μ

E[xn2]E[μ2]=E[xn2]μ2=σx2+E[xn]2μ2=σx2

che è imparziale!


3
+1 Potrebbe valere la pena notare che la tua dimostrazione non richiede che abbia una distribuzione gaussiana. (Tuttavia, per altre distribuzioni la varianza del campione potrebbe non essere l'MLE per il parametro varianza.)X
whuber

1
Grazie per la tua spiegazione. Ho bisogno di un po 'di tempo per capirlo. Inoltre, ho trovato qualche errore nelle equazioni. Puoi verificarlo? Grazie!
ningyuwhut,

@ whuber - Non so perché hai detto "..demonstration non richiede che abbia una distribuzione gaussiana". Non parleremmo della soluzione ML di varianza per ogni distribuzione, diciamo una distribuzione binomiale. Quindi implicitamente supponiamo che la distribuzione X abbia varianza come uno dei parametri. X
KGhatak,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.