Perché la deviazione standard del campione è uno stimatore distorto di


57

Secondo l'articolo di Wikipedia sulla stima imparziale della deviazione standard il campione SD

s=1n1i=1n(xix¯)2

è uno stimatore distorto della DS della popolazione. Indica che .E(s2)E(s2)

NB. Le variabili casuali sono indipendenti e ognixiN(μ,σ2)

La mia domanda è duplice:

  • Qual è la prova della parzialità?
  • Come si calcola l'aspettativa della deviazione standard del campione

La mia conoscenza di matematica / statistiche è solo intermedia.


4
Troverai risposta ad entrambe le domande nell'articolo di Wikipedia sulla distribuzione Chi .
whuber

Risposte:


57

La risposta di @ NRH a questa domanda fornisce una bella e semplice prova della distorsione della deviazione standard del campione. Qui calcolerò esplicitamente l'aspettativa della deviazione standard del campione (la seconda domanda del poster originale) da un campione normalmente distribuito, a quel punto la distorsione è chiara.

La varianza del campione imparziale di un insieme di punti èx1,...,xn

s2=1n1i=1n(xix¯)2

Se gli sono normalmente distribuiti, è un dato di fattoxi

(n1)s2σ2χn12

dove è la vera varianza. La distribuzione ha densità di probabilitàχ 2 kσ2χk2

p(x)=(1/2)k/2Γ(k/2)xk/21ex/2

usando questo possiamo ricavare il valore atteso di ;s

E(s)=σ2n1E(s2(n1)σ2)=σ2n10x(1/2)(n1)/2Γ((n1)/2)x((n1)/2)1ex/2 dx

che deriva dalla definizione di valore atteso e dal fatto che è la radice quadrata di una variabile distribuita . Il trucco ora è riorganizzare i termini in modo che l'integrando diventi un'altra densità :s2(n1)σ2χ2χ2

E(s)=σ2n10(1/2)(n1)/2Γ(n12)x(n/2)1ex/2 dx=σ2n1Γ(n/2)Γ(n12)0(1/2)(n1)/2Γ(n/2)x(n/2)1ex/2 dx=σ2n1Γ(n/2)Γ(n12)(1/2)(n1)/2(1/2)n/20(1/2)n/2Γ(n/2)x(n/2)1ex/2 dxχn2 density

ora sappiamo che l'integrazione e l'ultima riga è uguale a 1, poiché è una densità . Semplificare un po 'le costanti χn2

E(s)=σ2n1Γ(n/2)Γ(n12)

Quindi il pregiudizio di ès

σE(s)=σ(12n1Γ(n/2)Γ(n12))σ4n
come .n

Non è difficile vedere che questo bias non è 0 per qualsiasi finito , dimostrando così che la deviazione standard del campione è distorta. Sotto il bias c'è il diagramma in funzione di per in rosso insieme a in blu:nnσ=11/4n

inserisci qui la descrizione dell'immagine


(+1) Bella risposta. Spero non ti dispiaccia, ho modificato un paio di cose molto minori e ho aggiunto un risultato asintotico riguardo al pregiudizio. Suppongo che potresti sovrapporre la curva alla tua trama, ma probabilmente non è necessario. Saluti. :)(4n)1
cardinale

Hai fatto davvero molta fatica a fare questa Macro. Quando ho visto il post per la prima volta circa un minuto fa, stavo pensando di mostrare il pregiudizio usando la regola di Jensen, ma qualcuno l'ha già fatto.
Michael Chernick,

2
ovviamente questo è un modo per dimostrare che la deviazione standard è parziale - Stavo principalmente rispondendo alla seconda domanda del poster originale: "Come si calcola l'aspettativa della deviazione standard?".
Macro

2
Un altro punto forse degno di nota è che questo calcolo consente di leggere immediatamente ciò che lo stimatore UMVU della deviazione standard è nel caso gaussiano: si moltiplica semplicemente per il reciproco del fattore di scala che appare nella dimostrazione. Ciò si generalizza agli stimatori UMVU di abbastanza facilmente. sσk
cardinale

2
Scusa, Macro. Lo stesso approccio integrale di base che hai usato funzionerà, finirai con un diverso fattore di ridimensionamento di , con gli argomenti gamma che ottieni essere funzioni di . Questo è ciò che intendevo, ma è uscito un po 'troppo conciso. :)skk
cardinale

43

Non hai bisogno della normalità. Tutto ciò che serve è che è uno stimatore imparziale della varianza . Quindi usa che la funzione radice quadrata è strettamente concava tale che (da una forte forma di disuguaglianza di Jensen ) meno che la distribuzione di è degenerato in .

s2=1n1i=1n(xix¯)2
σ2
E(s2)<E(s2)=σ
s2σ2

19

A completamento della risposta di NRH, se qualcuno lo sta insegnando a un gruppo di studenti che non hanno ancora studiato la disuguaglianza di Jensen, un modo per procedere è definire la deviazione standard del campione supponi che non sia degenerato (quindi, ) e nota le equivalenze SnVar[Sn]00<Var[Sn]=E[S2n]-E2[Sn]

Sn=i=1n(XiX¯n)2n1,
SnVar[Sn]0
0<Var[Sn]=E[Sn2]E2[Sn]E2[Sn]<E[Sn2]E[Sn]<E[Sn2]=σ.
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.