Che cos'è uno stimatore della deviazione standard della deviazione standard se si può ipotizzare la normalità dei dati?
Che cos'è uno stimatore della deviazione standard della deviazione standard se si può ipotizzare la normalità dei dati?
Risposte:
Lasciate . Come mostrato in questa discussione , la deviazione standard della deviazione standard del campione,
è
dove è la funzione gamma , n è la dimensione del campione e ¯ X = 1è la media del campione. Poichésè uno stimatore coerente diσ, questo suggerisce di sostituireσconsnell'equazione precedente per ottenere uno stimatore coerente diSD(s).
Se è uno stimatore imparziale che cerchi, in questa discussione vediamo che , che, per linearità delle aspettative, suggerisce
come uno stimatore imparziale di . Tutto ciò insieme alla linearità delle aspettative fornisce uno stimatore imparziale di S D ( s ) :
Supponiamo di osservare iid da una normale con zero medio e varianza σ 2 . L'(empirica) deviazione standard è la radice quadrata dello stimatore σ 2 di σ 2 (non distorta o meno che non è la domanda). Come stimatore (ottenuto con X 1 , ... , X n ), σ ha una varianza che può essere calcolato teoricamente. Forse ciò che tu chiami la deviazione standard della deviazione standard è in realtà la radice quadrata della varianza della deviazione standard, cioè √ ? Non è uno stimatore, è una quantità teorica (qualcosa comeσ/ √ da confermare) che può essere calcolato esplicitamente!
@Macro ha fornito una grande spiegazione matematica con l'equazione da calcolare. Ecco un'esplorazione più generale per le persone meno matematiche.
Penso che la terminologia "SD of SD" sia confusa per molti. È più facile pensare all'intervallo di confidenza di una SD. Quanto è precisa la deviazione standard calcolata da un campione? Per caso, ti è capitato di ottenere dati strettamente raggruppati, rendendo la SD del campione molto più bassa della SD della popolazione. Oppure potresti avere valori casualmente ottenuti che sono molto più dispersi rispetto alla popolazione complessiva, rendendo la SD campione superiore alla SD popolazione.
L'interpretazione dell'IC della SD è semplice. Inizia con l'ipotesi abituale che i tuoi dati siano stati campionati in modo casuale e indipendente da una distribuzione gaussiana. Ora ripeti questo campionamento molte volte. Ti aspetti che il 95% di quegli intervalli di confidenza includa la vera popolazione SD.
Quanto è ampio l'intervallo di confidenza al 95% di una SD? Dipende ovviamente dalla dimensione del campione (n).
n: IC al 95% di SD
2: da 0,45 * SD a 31,9 * SD
3: da 0,52 * SD a 6,29 * SD
5: 0.60 * Da SD a 2.87 * SD
10: da 0,69 * SD a 1,83 * SD
25: 0,78 * Da SD a 1,39 * SD
50: 0,84 * Da SD a 1,25 * SD
100: 0,88 * Da SD a 1,16 * SD
500: 0.94 * Da SD a 1.07 * SD