Sto leggendo PRML e non capisco l'immagine. Potresti dare qualche suggerimento per capire il quadro e perché l'MLE della varianza in una distribuzione gaussiana è distorta?
formula 1.55: formula 1.56
Sto leggendo PRML e non capisco l'immagine. Potresti dare qualche suggerimento per capire il quadro e perché l'MLE della varianza in una distribuzione gaussiana è distorta?
formula 1.55: formula 1.56
Risposte:
Intuizione
La tendenza è "proveniente da" (per niente un termine tecnico) il fatto che è distorto per . La domanda naturale è: "beh, qual è l'intuizione del perché è distorto per "? L'intuizione è che in una media campionaria non quadrata, a volte ci manca il vero valore sopravvalutando e talvolta sottostimando. Ma, senza quadrare, la tendenza a sopravvalutare e sottostimare si annullerà a vicenda. Tuttavia, quando quadriamo la tendenza a sottovalutare (manca il vero valore dida un numero negativo) diventa anche quadrato e diventa quindi positivo. Pertanto, non si cancella più e c'è una leggera tendenza a sopravvalutare.
Se l'intuizione dietro perché è distorta per è ancora chiara, prova a capire l'intuizione dietro la disuguaglianza di Jensen (una buona spiegazione intuitiva qui ) e applicala a .
Dimostriamo che l'MLE della varianza per un campione iid è distorto. Quindi verificheremo analiticamente la nostra intuizione.
Prova
Lascia che .
Vogliamo mostrare .
Usando il fatto che e ,
Con l'ultimo passaggio che segue, dato che è uguale su causa della stessa distribuzione.
Ora, ricorda la definizione di varianza che dice . Da qui, otteniamo quanto segue
Si noti che abbiamo eliminato adeguatamente la costante quando la estraiamo da . Presta particolare attenzione a questo!
che ovviamente non è uguale a .
Verifica analiticamente la nostra intuizione
Possiamo in qualche modo verificare l'intuizione assumendo di conoscere il valore di e collegandolo alla dimostrazione di cui sopra. Dato che ora conosciamo , non abbiamo più la necessità di stimare e quindi non lo sopravvalutiamo mai con . Vediamo che questo "rimuove" il bias in .
Lascia che .
Dalla prova precedente, prendiamo da sostituendo con il valore reale .ˉ x μ
che è imparziale!