La varianza è un concetto più fondamentale della deviazione standard?


18

Su questo sito web di psicometria l' ho letto

[A] una varianza di livello profondo è un concetto più fondamentale della deviazione standard.

Il sito non spiega ulteriormente perché la varianza sia considerata più fondamentale della deviazione standard, ma mi ha ricordato che ho letto alcune cose simili su questo sito.

Ad esempio, in questo commento @ kjetil-b-halvorsen scrive che "la deviazione standard è buona per l'interpretazione, il reporting. Per lo sviluppo della teoria la varianza è migliore".

Sento che queste affermazioni sono collegate, ma non le capisco davvero. Capisco che la radice quadrata della varianza del campione non è uno stimatore imparziale della deviazione standard della popolazione, ma sicuramente ci deve essere qualcosa di più.

Forse il termine "fondamentale" è troppo vago per questo sito. In tal caso, forse possiamo rendere operativa la mia domanda chiedendomi se la varianza sia più importante della deviazione standard dal punto di vista dello sviluppo della teoria statistica. Perché perché no?


Non sono la stessa cosa? È come 1 + 1 è uguale a 2 * 1?
SmallChess,

2
La varianza è il secondo cumulativo, . L' articolo di Wikipedia sugli accumulatori dovrebbe stupire chiunque per quanto siano naturali e importanti, non solo per lo studio delle variabili casuali ma anche in fisica e combinatoria. La proprietà di multilinearità (che è fondamentale per eseguire i calcoli), così come l'estensione dei cumulativi alle distribuzioni multivariate, non è goduta dalla deviazione standard. κ2
whuber

Risposte:


16

Le risposte di Robert e Bey danno parte della storia (cioè i momenti tendono ad essere considerati come proprietà di base delle distribuzioni, e la deviazione standard convenzionalmente è definita in termini del secondo momento centrale piuttosto che il contrario), ma la misura in cui quelli le cose sono davvero fondamentali dipende in parte da ciò che intendiamo con il termine.

Non ci sarebbero problemi insormontabili, ad esempio, se le nostre convenzioni andassero dall'altra parte - non c'è nulla che ci fermi a definire convenzionalmente qualche altra sequenza di quantità al posto dei soliti momenti, diciamo per p = 1 , 2 , 3 , . . . (notare che μE[(X-μ)p]1/pp=1,2,3,...μsi adatta sia alla sequenza dei momenti che a questo come al primo termine) e quindi alla definizione dei momenti - e di tutti i tipi di calcoli in relazione ai momenti - in termini di essi. Si noti che queste quantità sono tutte misurate nelle unità originali, il che è un vantaggio nel corso dei momenti (che sono in -esima potenza delle unità originali e quindi più difficili da interpretare). Ciò renderebbe la deviazione standard della popolazione la quantità e la varianza definite in termini di essa.p

Tuttavia, renderebbe quantità come la funzione di generazione del momento (o qualche equivalente relativa alle nuove quantità sopra definite) piuttosto meno "naturali", il che renderebbe le cose un po 'più imbarazzanti (ma alcune convenzioni sono un po' così). Ci sono alcune proprietà convenienti dell'MGF che non sarebbero altrettanto comode.

Più semplice, a mio avviso (ma correlato ad esso), è che ci sono un certo numero di proprietà di base della varianza che sono più convenienti quando scritte come proprietà della varianza rispetto a quando scritte come proprietà della deviazione standard (ad esempio la varianza delle somme di indipendenti variabili casuali è la somma delle varianze).

Questa additività è una proprietà che non è condivisa da altre misure di dispersione e ha una serie di conseguenze importanti.

[Esistono relazioni simili tra gli altri cumulanti, quindi questo è un senso in cui potremmo voler definire le cose in relazione ai momenti più in generale.]

Tutte queste ragioni sono probabilmente convenzioni o convenienza, ma in una certa misura è una questione di punti di vista (ad esempio, da alcuni punti di vista i momenti sono quantità piuttosto importanti, da altri non sono poi così importanti). Può darsi che il bit "a livello profondo" non intenda implicare altro che quello di Kjetil "quando sviluppa la teoria".

Sono d'accordo con il punto di Kjetil che hai sollevato nella tua domanda; in una certa misura questa risposta è solo una discussione ondulata su di essa.


Direi che i due sono allo stesso posto, ognuno con il proprio set di comodità di accompagnamento.
JM non è uno statistico il

2

La varianza è definita dal primo e dal secondo momento di una distribuzione. Al contrario, la deviazione standard è più simile a una "norma" che a un momento. I momenti sono proprietà fondamentali di una distribuzione, mentre le norme sono solo modi per fare una distinzione.


2

La varianza è più fondamentale della deviazione standard perché la deviazione standard è definita come "la radice quadrata della varianza", ad esempio la sua definizione dipende completamente dalla varianza.

La varianza, d'altra parte, è definita - completamente indipendente - come "l'aspettativa della differenza quadrata tra un campione e la media".


3
Lo vedrei più come una relazione sui modi in cui (spesso) usiamo i termini, ad esempio nell'insegnamento, non come una riflessione su ciò che è fondamentale. È perfettamente possibile introdurre la deviazione standard senza menzionare la varianza (ancora) e molti testi e corsi lo fanno esattamente, proprio come si può parlare del teorema di Pitagora senza bisogno di usare nomi speciali per le quantità quadrate. Storicamente, il termine varianza nel suo significato statistico postdatizza quello della deviazione standard, quindi anche questa forma di parole è stata impossibile per alcuni decenni.
Nick Cox,

Mi sono reso conto che la deviazione standard era sorta come un'etichetta prima della varianza mentre cercavo di formulare una risposta al commento ora cancellato di Glen - al momento ho riflettuto sul fatto che il termine più vecchio era ora comunemente definito in termini di termine più recente rafforzato le affermazioni del nuovo termine di essere più fondamentali anziché indebolirle.
Robert de Graaf,

1
Si possono trovare tutti i tipi di spiegazioni. Nel mio insegnamento introduttivo di SD (ai geografi, non tutti matematicamente forti), non uso affatto il termine varianza . Sono pronto a sottolineare che SD è una misura di scala naturale per le distribuzioni normali (gaussiane), in quanto la distanza tra la media e l'inflessione sulla funzione di densità. Sospetto che sia più per il mio divertimento e piacere che per quello degli studenti.
Nick Cox,

0

nXVar[X]=σ2S2σ2Sσ

E[S2]=σ2, E[S]σ,

2
nn1

Var[]Var[iXi]=iVar[Xi]Xi
StijnDeVuyst

1
In effetti, l'additività delle varianze indipendenti è una proprietà fondamentale, ma non è questo il tuo argomento.
Nick Cox,

Forse ciò che è interessante è che, come con la media, è possibile costruire uno stimatore della varianza senza specificare un particolare distribuzione (stime non distorte della deviazione standard sono la distribuzione-specifica.)
Scortchi - Ripristinare Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.