Deviazione standard della deviazione standard


54

Che cos'è uno stimatore della deviazione standard della deviazione standard se si può ipotizzare la normalità dei dati?


Suppongo che tu stia cercando la distribuzione della varianza del campione . Questo si collega a una sezione della pagina Wikipedia sulla varianza del 16:55, 21 agosto 2016. Poiché si tratta di un collegamento a Wikipedia, l'articolo potrebbe cambiare in futuro. Pertanto, la sezione potrebbe non riflettere i contenuti a cui questa risposta si riferisce dopo tali modifiche. Pertanto, qui viene fornito un collegamento a una versione storica della pagina di Wikipedia. L'articolo attuale sulla varianza si trova [qui] ( en.wikipedia.org/wik

Risposte:


58

Lasciate . Come mostrato in questa discussione , la deviazione standard della deviazione standard del campione,X1,...,Xn~N(μ,σ2)

S=1n-1Σio=1n(Xio-X¯),

è

SD(S)=E([E(S)-S]2)=σ1-2n-1(Γ(n/2)Γ(n-12))2

dove è la funzione gamma , n è la dimensione del campione e ¯ X = 1Γ()nè la media del campione. Poichésè uno stimatore coerente diσ, questo suggerisce di sostituireσconsnell'equazione precedente per ottenere uno stimatore coerente diSD(s).X¯=1nΣio=1nXioSσσSSD(S)

Se è uno stimatore imparziale che cerchi, in questa discussione vediamo che , che, per linearità delle aspettative, suggerisceE(S)=σ2n-1Γ(n/2)Γ(n-12)

Sn-12Γ(n-12)Γ(n/2)

come uno stimatore imparziale di . Tutto ciò insieme alla linearità delle aspettative fornisce uno stimatore imparziale di S D ( s ) : σSD(S)

SΓ(n-12)Γ(n/2)n-12-(Γ(n/2)Γ(n-12))2

12
+1 È bello vedere non solo una risposta migliore arriva dopo quasi due anni, ma una risposta che fornisce dettagli più utili rispetto ai riferimenti altrove in questa discussione.
whuber

2
Hai dimenticato di quadrare le distanze nella prima formula?
danijar,

2
La funzione Gamma è difficile da calcolare per valori non piccoli di . Applicando l'approssimazione di Stirling, ottengo s n, che è fattibile dal punto di vista computazionale e un po 'più compatto in termini di espressione. Se(1-1n)n-1-1
equaeghe

1
Probabilmente vale la pena sottolineare che s (calcolato nella risposta di @ Macro viene talvolta indicato come errore standard della deviazione standard del campione.
Harvey Motulsky

Per chi desidera una forma semplice, è una buona approssimazione a un livello di qualche percento. S/2(n-1)
Syrtis Major,

5

Supponiamo di osservare iid da una normale con zero medio e varianza σ 2 . L'(empirica) deviazione standard è la radice quadrata dello stimatore σ 2 di σ 2 (non distorta o meno che non è la domanda). Come stimatore (ottenuto con X 1 , ... , X n ), σ ha una varianza che può essere calcolato teoricamente. Forse ciò che tu chiami la deviazione standard della deviazione standard è in realtà la radice quadrata della varianza della deviazione standard, cioè X1,...,Xnσ2σ^2σ2X1,...,Xnσ^ ? Non è uno stimatore, è una quantità teorica (qualcosa comeσ/E[(σ-σ^)2] da confermare) che può essere calcolato esplicitamente!σ/n


Una funzione dello stimatore non è ancora uno stimatore? Non so ancora \ sigma, solo X_i.

ok, allora si avrà probabilmente stimare la radice quadrata della varianza della stima della radice quadrata della varianza ... giusto :) dovrebbe essere qualcosa come σ / n ? σ^/n
Robin Girard,

Ciò che Srikant ha trovato (e ciò che sembra confermato in PhysicsForums) dovrebbe essere , quindi piuttosto σ2 . σ^22n

1
Aww, quei commenti bloccano; σ . Almeno questo dà il risultato in accordo con bootstrap. σ^2n

-3

@Macro ha fornito una grande spiegazione matematica con l'equazione da calcolare. Ecco un'esplorazione più generale per le persone meno matematiche.

Penso che la terminologia "SD of SD" sia confusa per molti. È più facile pensare all'intervallo di confidenza di una SD. Quanto è precisa la deviazione standard calcolata da un campione? Per caso, ti è capitato di ottenere dati strettamente raggruppati, rendendo la SD del campione molto più bassa della SD della popolazione. Oppure potresti avere valori casualmente ottenuti che sono molto più dispersi rispetto alla popolazione complessiva, rendendo la SD campione superiore alla SD popolazione.

L'interpretazione dell'IC della SD è semplice. Inizia con l'ipotesi abituale che i tuoi dati siano stati campionati in modo casuale e indipendente da una distribuzione gaussiana. Ora ripeti questo campionamento molte volte. Ti aspetti che il 95% di quegli intervalli di confidenza includa la vera popolazione SD.

Quanto è ampio l'intervallo di confidenza al 95% di una SD? Dipende ovviamente dalla dimensione del campione (n).

n: IC al 95% di SD

2: da 0,45 * SD a 31,9 * SD

3: da 0,52 * SD a 6,29 * SD

5: 0.60 * Da SD a 2.87 * SD

10: da 0,69 * SD a 1,83 * SD

25: 0,78 * Da SD a 1,39 * SD

50: 0,84 * Da SD a 1,25 * SD

100: 0,88 * Da SD a 1,16 * SD

500: 0.94 * Da SD a 1.07 * SD

Calcolatore web gratuito


Posso fare Monte Carlo, volevo solo farlo in un modo più "scientifico"; hai ancora ragione che la distribuzione non è normale, quindi questo SD sarà inutile per i test.

4
Per quello che vale, mi sento a disagio con l'affermazione "un intervallo di confidenza che è del 95% ... probabilmente conterrà la vera SD" (o, dichiarato più esplicitamente nella pagina collegata: "puoi essere sicuro al 95% che il L'IC calcolato dalla SD di esempio contiene la SD di popolazione reale "). Penso che queste affermazioni flirtino con il rafforzamento di un malinteso popolare, vedere qui , ad esempio, per una discussione correlata sul CV.
gung - Ripristina Monica

5
Che cosa significa "Penso che sia il concetto che la terminologia di" SD di SD "siano troppo scivolosi per affrontare" dovrebbe significare? La deviazione standard del campione è una variabile casuale che ha una deviazione standard.
Macro

@Macro. Grazie per i tuoi commenti Ho riscritto sostanzialmente.
Harvey Motulsky,

1
@gung. Ho riscritto per spiegare correttamente l'intervallo di confidenza.
Harvey Motulsky,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.