Qual è la differenza tra varianza e deviazione standard?


127

Mi chiedevo quale fosse la differenza tra la varianza e la deviazione standard.

Se calcoli i due valori, è chiaro che ottieni la deviazione standard dalla varianza, ma cosa significa in termini di distribuzione che stai osservando?

Inoltre, perché hai davvero bisogno di una deviazione standard?



12
Probabilmente hai già ricevuto la risposta. Tuttavia questo link ha la spiegazione più semplice e migliore. mathsisfun.com/data/standard-deviation.html

2
La deviazione standard è utile in quanto il valore è nella stessa scala dei dati da cui è stato calcolato. Se si misurano i misuratori, la deviazione standard sarà misuratori. La varianza, al contrario, sarà di metri quadrati.
Vladislavs Dovgalecs,

1
La variazione standard può essere imparziale, ma la deviazione standard no perché la funzione radice quadrata non è lineare.
Daksh Gargas,

Risposte:


85

La deviazione standard è la radice quadrata della varianza.

La deviazione standard è espressa nelle stesse unità della media, mentre la varianza è espressa in unità quadrate, ma per guardare una distribuzione, è possibile utilizzare solo se si è chiari su ciò che si sta utilizzando. Ad esempio, una distribuzione normale con media = 10 e sd = 3 è esattamente la stessa cosa di una distribuzione normale con media = 10 e varianza = 9.


58
sì, questo è il modo matematico per spiegare questi due parametri, MA qual è l'esplicazione logica? Perché ho davvero bisogno di due parametri per mostrare la stessa cosa (la deviazione attorno alla media aritmetica) ...
Le Max

5
Non hai davvero bisogno di entrambi. Se ne riferisci uno, non devi segnalare l'altro
Peter Flom

8
Abbiamo bisogno di entrambi: la deviazione standard è buona per l'interpretazione e la comunicazione. Per lo sviluppo della teoria la varianza è migliore.
kjetil b halvorsen,

4
Il vantaggio di segnalare la deviazione standard è che rimane nella scala dei dati. Ad esempio, un campione di altezze per adulti è in metri, quindi anche la deviazione standard sarà in metri.
Vladislavs Dovgalecs,

5
@RushatRai Quando si ha a che fare con somme di variabili casuali, le varianze vengono sommate. Per variabili casuali indipendenti, . Un'espressione simile esiste nel caso generale senza indipendenza (con una correzione usando termini di covarianza). In generale, la trasformazione della radice quadrata complica le cose e rende più difficile lavorare in modo analitico sulla deviazione standard. Vun'r(ΣXio)=ΣVun'r(Xio)
Knrumsey,

49

Non hai bisogno di entrambi. Ognuno di essi ha scopi diversi. La DS è generalmente più utile per descrivere la variabilità dei dati mentre la varianza è di solito molto più utile matematicamente. Ad esempio, la somma delle distribuzioni non correlate (variabili casuali) ha anche una varianza che è la somma delle varianze di tali distribuzioni. Questo non sarebbe vero per la SD. D'altra parte, la SD ha la comodità di essere espressa in unità della variabile originale.


24

Se John si riferisce a variabili casuali indipendenti quando dice "distribuzioni non correlate", allora la sua risposta è corretta. Tuttavia, per rispondere alla tua domanda, ci sono diversi punti che possono essere aggiunti:

  1. La media e la varianza sono i due parametri che determinano una distribuzione normale.

  2. K

  3. z0t

  4. 68%195.4%299%3

  5. Il margine di errore è espresso come multiplo della deviazione standard della stima.

  6. Varianza e distorsione sono misure di incertezza in una quantità casuale. L'errore quadratico medio per una stima è uguale alla varianza + alla distorsione al quadrato.


4
Probabilmente non dovresti dire "parametro naturale", che sono media divisi per varianza, e 1 diviso per varianza: en.wikipedia.org/wiki/Natural_parameter
Neil G

σ

Al punto 3, non dovrebbe essere "deviazione standard utilizzata per standardizzare le statistiche" invece di normalizzare?
Harry,

15

La varianza di un set di dati misura la dispersione matematica dei dati rispetto alla media. Tuttavia, sebbene questo valore sia teoricamente corretto, è difficile applicarlo in un senso del mondo reale perché i valori utilizzati per calcolarlo erano al quadrato. La deviazione standard, poiché la radice quadrata della varianza fornisce un valore che è nelle stesse unità dei valori originali, il che rende molto più facile lavorare e interpretare più facilmente insieme al concetto della curva normale.


Questo fa un ottimo lavoro spiegando il perché in termini semplici.
gwg,

3
Un altro buon punto da sottolineare sarebbe che ogni metrica sd e var misura la diffusione della variabile attorno alla media. Prendere la radice quadrata della varianza per ottenere la deviazione standard potrebbe essere visto come un fattore di ridimensionamento applicato per riportare la metrica in unità della variabile.
Matt L.

6

In termini di distribuzione sono equivalenti (ma ovviamente non intercambiabili), ma attenzione che in termini di stimatori non lo sono: la radice quadrata di una stima della varianza NON è uno stimatore (imparziale) della deviazione standard. Solo per un numero moderatamente elevato di campioni (e in base agli stimatori) i due si avvicinano. Per campioni di piccole dimensioni è necessario conoscere la forma parametrica della distribuzione da convertire tra i due, che può diventare leggermente circolare.


4

Durante il calcolo della varianza, abbiamo quadrato le deviazioni. Significa che se i dati (osservazioni) dati sono in metri, diventeranno metri quadrati. Spero non sia una rappresentazione corretta delle deviazioni. Quindi, quadriamo nuovamente di root (SD) che non è altro che SD.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.