La risposta di @ NRH a questa domanda fornisce una bella e semplice prova della distorsione della deviazione standard del campione. Qui calcolerò esplicitamente l'aspettativa della deviazione standard del campione (la seconda domanda del poster originale) da un campione normalmente distribuito, a quel punto la distorsione è chiara.
La varianza del campione imparziale di un insieme di punti èx1,...,xn
s2=1n−1∑i=1n(xi−x¯¯¯)2
Se gli sono normalmente distribuiti, è un dato di fattoxi
(n−1)s2σ2∼χ2n−1
dove è la vera varianza. La distribuzione ha densità di probabilitàχ 2 kσ2χ2k
p(x)=(1/2)k/2Γ(k/2)xk/2−1e−x/2
usando questo possiamo ricavare il valore atteso di ;s
E(s)=σ2n−1−−−−−√E(s2(n−1)σ2−−−−−−−−√)=σ2n−1−−−−−√∫∞0x−−√(1/2)(n−1)/2Γ((n−1)/2)x((n−1)/2)−1e−x/2 dx
che deriva dalla definizione di valore atteso e dal fatto che è la radice quadrata di una variabile distribuita . Il trucco ora è riorganizzare i termini in modo che l'integrando diventi un'altra densità :s2(n−1)σ2−−−−−−√χ2χ2
E(s)=σ2n−1−−−−−√∫∞0(1/2)(n−1)/2Γ(n−12)x(n/2)−1e−x/2 dx=σ2n−1−−−−−√⋅Γ(n/2)Γ(n−12)∫∞0(1/2)(n−1)/2Γ(n/2)x(n/2)−1e−x/2 dx=σ2n−1−−−−−√⋅Γ(n/2)Γ(n−12)⋅(1/2)(n−1)/2(1/2)n/2∫∞0(1/2)n/2Γ(n/2)x(n/2)−1e−x/2 dxχ2n density
ora sappiamo che l'integrazione e l'ultima riga è uguale a 1, poiché è una densità . Semplificare un po 'le costanti χ2n
E(s)=σ⋅2n−1−−−−−√⋅Γ(n/2)Γ(n−12)
Quindi il pregiudizio di ès
σ−E(s)=σ(1−2n−1−−−−−√⋅Γ(n/2)Γ(n−12))∼σ4n
come .
n→∞
Non è difficile vedere che questo bias non è 0 per qualsiasi finito , dimostrando così che la deviazione standard del campione è distorta. Sotto il bias c'è il diagramma in funzione di per in rosso insieme a in blu:nnσ=11/4n