Decomposizione MSE a varianza e bias al quadrato


23

Nel mostrare che MSE può essere scomposto in varianza più il quadrato di Bias, la dimostrazione in Wikipedia ha un passo, evidenziato in figura. Come funziona? In che modo le aspettative vengono inviate al prodotto dal 3 ° al 4 ° passaggio? Se i due termini sono indipendenti, l'aspettativa non dovrebbe essere applicata a entrambi i termini? e se non lo sono, questo passaggio è valido?inserisci qui la descrizione dell'immagine

Risposte:


22

Il trucco è che è una costante.E(θ^)θ


1
Oh, capisco. L'unico sconosciuto qui è lo stimatore. Destra?
statBeginner

2
Sì. Accettare le aspettative significa che lo stimatore va su qualunque cosa stia stimando, questo è ciò che rende andare a 0.E(θ^E(θ^))
AdamO

5
Scusa, quella frase non ha molto senso per me. Se uno stimatore andasse a qualunque cosa stesse stimando, non lo renderebbe imparziale? Può essere spiegato dicendo = = = 0? E ( θ ) - E ( E ( θ ) ) E ( θ ) - E ( θ )E(θ^E(θ^))E(θ^)E(E(θ^))E(θ^)E(θ^)
user1158559

@utente1158559 il termine del prodotto nel mezzo è un tempo costante qualcosa con valore atteso 0. Anche se il cappello theta è distorto, è ancora un tempo costante 0.
AdamO

3
E ( c ) c E ( ( E ( θ ) - θ ) 2 ) 0 x p ( x ) ( x p ( x ) ) p ( x ) = ( x p ( x ) ) p ( x ) =E(θ^)θ è una variabile e non una costante. Inoltre, il trucco è meno banale e con una costante non diventa 0 come predefinito (ad esempio ). Il vero trucco sta nel fatto che è la costante (e può essere estratta da un integrale) quindiE(c)cE((E(θ^)θ)2)0xp(x)(xp(x))p(x)=(xp(x))p(x)=(xp(x))1=(xp(x))
Sisto Empirico

4

La risposta di Adam è corretta riguardo al trucco secondo cui è una costante. Tuttavia aiuta a trovare il risultato finale e non spiega chiaramente la domanda sul passaggio specifico nell'articolo di Wikipedia (modifica: che vedo ora era ambiguo sull'evidenziazione e sul passaggio dalla riga tre alla riga quattro).E(θ^)θ

(nota che la domanda riguarda la variabile , che differisce dalla costante nella risposta di Adam. Ho scritto questo errore nel mio commento. Espandendo i termini per maggiore chiarezza: la variabile è la stima , le costanti sono le aspettative di questa stima e il vero valore ) E [ θ ] - θ θ E [ θ ] θE[θ^]θ^ E[θ^]θθ^E[θ^]θ

Trucco 1: considera

la variabilex=θ^

la costantea=E[θ^]

e la costanteb=θ

Quindi la relazione può essere scritta facilmente usando le regole di trasformazione che esprimono i momenti della variabile su in termini dei momenti della variabile su .b x axbxa

E[(xb)n]=i=0n(ni)E[(xa)i](ab)ni

Trucco 2: per il secondo momento la formula sopra ha tre termini nella somma. Possiamo eliminarne uno (il caso ) perchéE [ ( θ - E [ θ ] ) ] = E [ θ ] - E [ E [ θ ] ] = 0i=1E[(θ^E[θ^])]=E[θ^]E[E[θ^]]=0

Qui si può anche argomentare con qualcosa che è una costante. Vale a dire se è una costante e usando , che è una costante, ottieni .a a = E ( θ ) E ( E ( θ ) ) = E ( θ )E(a)=aaa=E(θ)E(E(θ))=E(θ)

Più intuitivamente: abbiamo reso il momento di circa , uguale a un momento centrale (e i momenti centrali dispari sono zero). Abbiamo un po 'di tautologia. Sottraendo la media dalla variabile, , generiamo una variabile con zero medio. E la media di "una variabile con zero medio" è zero.un θ - E [ θ ]xaθ^E[θ^]


L'articolo di Wikipedia utilizza questi due trucchi rispettivamente nella terza e quarta riga.

  • L'attesa nidificata nella terza riga

    E[(θ^E(θ^))(E(θ^)θ)]

    viene semplificato prendendo la parte costante al di fuori di esso (trucco 1).(E(θ^)θ)

  • Il termine è risolto (come uguale a zero) usando il fatto che la variabile ha zero medio (trucco 2). θ -E( θ )E(θ^E(θ^))θ^E(θ^)


3

E(θ^)θ non è una costante.

Il commento di @ user1158559 è in realtà quello corretto:

E[θ^E(θ^)]=E(θ^)E[E(θ^)]=E(θ^)E(θ^)=0

Non vedo cosa stai cercando di mostrare. Anche il bias potrebbe non essere zero ma ciò non significa che non sia una costante.
Michael R. Chernick,

Non è una costante perché dove è un dato dati di allenamento, che è anche una variabile casuale. Pertanto, la sua aspettativa non è una costante. Dθ^=f(D)D
little_monster,

Inoltre, il fatto che non sia una costante o meno non può spiegare come sia possibile il passaggio 4 dal passaggio 3. D'altra parte, il commento di @ user1158559 lo spiega.
little_monster,

@Michael, c'è stata confusione riguardo alla domanda. La parte evidenziata contiene questa espressione , ma nel testo della domanda si dice che è invece circa il passaggio dalla terza alla quarta riga, cambiando la nidificazione delle aspettative. E(θ^E(θ^))=0
Sesto Empirico,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.