Non sono sicuro che si tratti di una questione puramente americana o britannica. Il resto di questa pagina è estratto da una domanda che ho scritto ( http://www.graphpad.com/faq/viewfaq.cfm?faq=1383 ).
Come calcolare la SD con n-1 nel denominatore
Calcola il quadrato della differenza tra ciascun valore e la media del campione.
Aggiungi quei valori.
Dividi la somma per n-1. Il risultato si chiama varianza.
Prendi la radice quadrata per ottenere la deviazione standard.
Perché n-1?
Perché dividere per n-1 anziché per n quando si calcola una deviazione standard? Nel passaggio 1, si calcola la differenza tra ciascun valore e la media di tali valori. Non conosci la vera media della popolazione; tutto quello che sai è la media del tuo campione. Ad eccezione dei rari casi in cui la media del campione coincide con la media della popolazione, i dati saranno più vicini alla media del campione di quanto non lo saranno alla media della popolazione reale. Quindi il valore che calcoli nel passaggio 2 sarà probabilmente un po 'più piccolo (e non può essere più grande) di quello che sarebbe se tu usassi la media della vera popolazione nel passaggio 1. Per compensare, dividi per n-1 piuttosto di nv Questo si chiama correzione di Bessel.
Ma perché n-1? Se sapessi la media del campione e tutti i valori tranne uno, potresti calcolare quale deve essere l'ultimo valore. Gli statistici dicono che ci sono n-1 gradi di libertà.
Quando la SD dovrebbe essere calcolata con un denominatore di n invece di n-1?
I libri statistici mostrano spesso due equazioni per calcolare la SD, una usando n e l'altra usando n-1, nel denominatore. Alcuni calcolatori hanno due pulsanti.
L'equazione n-1 viene utilizzata nella situazione comune in cui si sta analizzando un campione di dati e si desidera trarre conclusioni più generali. La SD calcolata in questo modo (con n-1 nel denominatore) è la tua ipotesi migliore per il valore della SD nella popolazione complessiva.
Se si desidera semplicemente quantificare la variazione in un determinato insieme di dati e non si prevede di estrapolare per trarre conclusioni più ampie, è possibile calcolare la SD utilizzando n nel denominatore. La SD risultante è la SD di quei valori particolari. Non ha senso calcolare la SD in questo modo se si desidera stimare la SD della popolazione da cui sono stati estratti quei punti. Ha senso usare n nel denominatore quando non c'è campionamento da una popolazione, non c'è desiderio di trarre conclusioni generali.
L'obiettivo della scienza è quasi sempre quello di generalizzare, quindi l'equazione con n nel denominatore non dovrebbe essere usata. L'unico esempio che mi viene in mente dove potrebbe avere senso è quantificare la variazione tra i punteggi degli esami. Ma molto meglio sarebbe mostrare un diagramma a dispersione di ogni punteggio o un istogramma di distribuzione delle frequenze.