Quello che vuoi trovare è la deviazione standard della distribuzione campionaria della media. Cioè, in parole povere, la distribuzione campionaria avviene quando scegli elementi dalla tua popolazione, sommali e dividi la somma per . Noi di trovare la varianza di questa quantità e ottenere la deviazione standard prendendo la radice quadrata della sua varianza.nn
Quindi, lascia che gli elementi che scegli siano rappresentati dalle variabili casuali , ognuna delle quali identicamente distribuita con varianza . Vengono campionati indipendentemente, quindi la varianza della somma è solo la somma delle varianze.
Xi,1≤i≤nσ2
Var(∑i=1nXi)=∑i=1nVar(Xi)=∑i=1nσ2=nσ2
Successivamente dividiamo per . Sappiamo in generale che , quindi inserendo abbiamonVar(kY)=k2Var(Y)k=1/n
Var(∑ni=1Xin)=1n2Var(∑i=1nXi)=1n2nσ2=σ2n
Infine, prendi la radice quadrata per ottenere la deviazione standard . Quando la deviazione standard della popolazione non è disponibile, la deviazione standard del campione viene utilizzata come stima, fornendo .σn−−√ssn−−√
Tutto quanto sopra è vero indipendentemente dalla distribuzione di s, ma pone la domanda su cosa vuoi veramente fare con l'errore standard? In genere potresti voler costruire intervalli di confidenza, ed è quindi importante assegnare una probabilità alla costruzione di un intervallo di confidenza che contenga la media.Xi
Se i tuoi sono normalmente distribuiti, questo è facile, perché anche la distribuzione di campionamento è normalmente distribuita. Si può dire che il 68% dei campioni della media si troverà all'interno di 1 errore standard della media reale, il 95% sarà entro 2 errori standard, ecc.Xi
Se hai un campione abbastanza grande (o un campione più piccolo e gli non sono troppo anormali) allora puoi invocare il teorema del limite centrale e dire che la distribuzione del campionamento è approssimativamente distribuita normalmente e anche le tue dichiarazioni di probabilità sono approssimative.Xi
Un caso in questione è la stima di una proporzione , in cui si disegnano elementi ciascuno da una distribuzione di Bernouilli. La varianza di ogni distribuzione è e quindi l'errore standard è (la proporzione viene stimata utilizzando i dati). Per poi saltare a dire che circa un po 'del% dei campioni si trova all'interno di così tante deviazioni standard della media, è necessario capire quando la distribuzione del campionamento è approssimativamente normale. Il campionamento ripetuto da una distribuzione di Bernouilli è lo stesso del campionamento da una distribuzione binomiale e una regola pratica comune è quella di approssimarsi solo quando e sonopnXip(1−p)p(1−p)/n−−−−−−−−−√pnpn(1−p)≥5. (Vedi Wikipedia per una discussione più approfondita sull'approssimazione del binomio con normale. Vedi qui per un esempio funzionante di errori standard con una proporzione.)
Se, d'altra parte, la distribuzione del campionamento non può essere approssimata da una distribuzione normale, l'errore standard è molto meno utile. Ad esempio, con una distribuzione asimmetrica molto distorta non si può dire che la stessa% di campioni sarebbe una deviazione standard entrambi i lati della media e si potrebbe desiderare di trovare un modo diverso di associare le probabilità ai campioni.±1