Perché la radice quadrata viene presa per il conteggio dei campioni "N" nella formula di deviazione standard?


9

Sto cercando di capire un concetto basilare di deviazione standard.

Dalla formula σ=i=1n(xiμ)2N

Non riesco a capire perché dovremmo dimezzare la popolazione "N", cioè perché vogliamo prendere N quando non abbiamo fattoN2 ? Ciò non distorce la popolazione che stiamo prendendo in considerazione?

Non dovrebbe essere la formula essere σ=i=1n(xiμ)2N

Risposte:


10

Stai cercando di trovare una deviazione "tipica" dalla media.

La varianza è "la distanza media quadrata dalla media".

La deviazione standard è la radice quadrata di quello.

Questo lo rende la deviazione quadrata radice-media dalla media.

  1. Perché dovremmo usare la deviazione quadrata media? Cosa rende interessante la varianza? Tra l'altro, a causa di un fatto di base sulle varianze , che la varianza di una somma di variabili non correlate è la somma delle singole varianze. (Questo è trattato in una serie di domande, ad esempio qui su CrossValidated. Questa utile funzione non è condivisa, ad esempio, dalla media della deviazione assoluta.
  2. Perché prendere la radice quadrata di quello? Perché allora è nelle stesse unità delle osservazioni originali. Misura un particolare tipo di "distanza tipica" dalla media (come detto, la distanza RMS) - ma a causa della proprietà di varianza sopra - quella che ha delle belle caratteristiche.

7

La deviazione standard è la radice quadrata della varianza .


Var(X)=E[(Xμ)2]=i=1N(xiμ)2N

S.D.(X)=Var(X)=i=1N(xiμ)2N

forse va detto che questa formula di varianza è vera solo per le divise discrete. altrimenti potrebbe confondere la distinzione tra varianza del campione e della popolazione
Taylor

@ Taylor, non so cosa intendi. La formula per la varianza non è correlata alla distribuzione.
gung - Ripristina Monica

la formula per la varianza (campione) non è correlata alla distribuzione ( en.wikipedia.org/wiki/Expected_value#Definition )
Taylor

@ Taylor, non so ancora cosa intendi. La formula per la varianza non è correlata alla distribuzione. Per citare dalla pagina di Wikipedia, "La varianza di una variabile casuale, X, è il valore atteso della deviazione al quadrato dalla media di X ... . Questa definizione comprende variabili casuali generate da processi discreti, continui, nessuno dei due o misti. " La formula non vale solo per l'uniforme discreta. Var(X)=E[(Xμ)2]
gung - Ripristina Monica

Sì, esatto, se prendi , ma non è necessariamente uguale, per qualsiasi variabile casuale , . Per uno, il primo è una costante e il secondo è casuale. In realtà non è chiaro se la somma passi sul supporto di o sul numero di campioni. In quest'ultimo caso, è strano che tu conosca , cosa rara in pratica. Se il primo, allora sì, è vero solo per le divise discrete (perché è una somma) (perché i pesi sono tutti uniformi). μ=EXE[(Xμ)2]X1Ni(xiμ)2Xμ
Taylor,

1

La prima cosa da capire è che la deviazione standard (std) è diversa dalla deviazione assoluta media . Questi due definiscono diverse proprietà matematiche sui dati.

A differenza della deviazione assoluta media, la deviazione standard (std) pesa di più per i valori che sono lontani dalla media, il che viene fatto quadrando i valori della differenza.

Ad esempio, per i seguenti quattro punti dati:

Data(x)|xmean|(xmean)222422466366636x=0(|xmean|)=16(xmean)2=80

deviazione assoluta media (aad) e=16/4=4.0

Deviazione standard (std) =80/4=20=4.47

Nei dati, ci sono due punti distanti 6 dalla media e due punti distanti 2 dalla media. Quindi, la deviazione di 4,47 ha più senso di 4.

Dato che l'osservazione totale è sempre , per il calcolo di std non ci stiamo immergendo per , invece dividiamo la varianza totale per e ne prendiamo la radice quadrata, per portarla alla stessa unità dei dati originali.NNN


0

@Mahesh Subramaniya - Questa è solo una svolta matematica . Quando abbiamo un valore originale come . Possiamo ottenere lo stesso valore usando queste due equazioni e .a/b=()da2b=ccb=d

Ad esempio, basta farlo con = . Vogliamo solo valore non meno.522.5

Ora, . E522=12.512.52=2.5

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.