Come funziona l'errore standard?


17

Di recente ho esaminato il funzionamento interno dell'errore standard e mi sono trovato incapace di capire come funziona. La mia comprensione dell'errore standard è che si tratta della deviazione standard della distribuzione dei mezzi di campionamento. Le mie domande sono:

• come facciamo a sapere se l'errore standard è la deviazione standard del campione quando di solito prendiamo un solo campione?

• perché l'equazione per calcolare l'errore standard non rispecchia l'equazione della deviazione standard per un singolo campione?


Quando dici "singolo campione" intendi un set di campioni o davvero una dimensione del campione di 1?
Erik,

1
Questi sono spiegati per un problema semplice ma interessante (una risposta ternaria) in un linguaggio semplice e non statistico su stats.stackexchange.com/a/18609 .
whuber

Risposte:


13

Sì, l'errore standard della media (SEM) è la deviazione standard (SD) della media. (L'errore standard è un altro modo di dire SD di una distribuzione di campionamento. In questo caso, la distribuzione di campionamento è un mezzo per campioni di dimensioni fisse, diciamo N.) Esiste una relazione matematica tra il SEM e la popolazione SD: SEM = popolazione SD / radice quadrata di N. Questa relazione matematica è molto utile, poiché non abbiamo quasi mai una stima diretta del SEM ma abbiamo una stima della SD della popolazione (vale a dire la SD del nostro campione). Per quanto riguarda la tua seconda domanda, se dovessi raccogliere più campioni di dimensione N e calcolare la media per ciascun campione, potresti stimare il SEM semplicemente calcolando la DS dei mezzi. Quindi la formula per SEM rispecchia effettivamente la formula per la SD di un singolo campione.


13

Supponiamo che siano indipendenti e distribuiti in modo identico. Questa è la situazione a cui sono abbastanza sicuro che ti riferisci. Lascia che la loro media comune sia μ e la loro varianza comune sia σ 2X1,X2,...,Xnμσ2 .

Ora la media del campione è . La linearità di aspettativa mostra che anche la media di X b è μ . Il presupposto di indipendenza implica che la varianza di X b è la somma delle varianze dei suoi termini. Ciascuno di questi termini X i / n ha varianza σ 2 / n 2 (poiché la varianza di una costante per una variabile casuale è la costante quadrata per la varianza della variabile casuale). Abbiamo nXB=ΣioXio/nXBμXBXio/nσ2/n2nin modo identico distribuito tali variabili per riassumere, quindi ogni termine ha la stessa varianza. Di conseguenza, otteniamo per la varianza della media del campione.nσ2/n2=σ2/n

Di solito non conosciamo e quindi dobbiamo stimarlo dai dati. A seconda dell'impostazione, ci sono vari modi per farlo. Le due stime più comuni e generiche di σ 2 sono la varianza del campione s 2 = 1σ2σ2 e un piccolo multiplo di esso,s 2 u =nS2=1nΣio(Xio-XB)2(che è uno stimatore imparziale diσ2). Utilizzando uno di questi al posto diSu2=nn-1S2σ2 nel paragrafo precedente e prendendo la radice quadrata si ottiene l'errore standard sotto forma di s / σ2S/n o .Su/n


1
Questo va molto bene. Hai suggerimenti per libri o letture per sviluppare una linea simile di capacità di pensiero. Grazie.
q126y

Risposta elegante!
Jinhua Wang

7

+1 a entrambi @JoelW. & @MichaelChernick. Voglio aggiungere un dettaglio alla risposta di @ JoelW. Egli osserva che "non abbiamo quasi mai una stima diretta del SEM", il che è essenzialmente vero, ma vale la pena riconoscere esplicitamente un avvertimento a tale affermazione. In particolare, quando uno studio confronta più gruppi / trattamenti (ad esempio, placebo rispetto al farmaco standard rispetto al nuovo farmaco), un ANOVA viene in genere utilizzato per vedere se sono tutti uguali. L'ipotesi nulla è che ogni gruppo sia stato tratto dalla stessa popolazione e quindi, tutte e tre le medie sono stime della media della popolazione. Cioè, l'ipotesi nulla in un ANOVA standard presuppone che tu abbia una stima diretta del SEM. Considera l'equazione per la varianza della distribuzione campionaria delle medie :

σX¯2=σpop2nj,
σpop2njF
F=nj×SX¯2Sraggruppati all'interno del gruppo2
SX¯2=Σj=1nj(X¯j-X¯.)2nj-1,
con X. essere la media del gruppo significa.

In ciò in genere crediamo che l'ipotesi nulla non sia vera, il punto di @ JoelW. è giusto, ma lavoro su questo punto, perché penso che la chiarezza che offre sia utile per comprendere questi problemi.


2
Penso che il tuo commento sia sostanzialmente lo stesso di questo, che è stato scritto con meno notazione matematica: stats.stackexchange.com/questions/32206/…
Joel W.
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.