Cosa ci dice la deviazione standard nella distribuzione non normale


40

In una distribuzione normale, la regola 68-95-99.7 conferisce molto significato alla deviazione standard, ma cosa significherebbe la deviazione standard in una distribuzione non normale (multimodale o obliqua)? Tutti i valori dei dati rientrerebbero comunque entro 3 deviazioni standard? Abbiamo regole come quella 68-95-99.7 per le distribuzioni non normali?


16
Dai un'occhiata alla disuguaglianza di Chebyshev .
COOLSerdash,

@COOLSerdash fantastico. Questo risponde perfettamente alla mia domanda.
Zuhaib Ali,

3
Il punto di @ COOLSerdash è qui mirato, ma tieni presente che l'affermazione standard della disuguaglianza di Chebyshev riguarda la vera SD conosciuta a priori, non una SD stimata dal tuo campione. Potrebbe essere utile leggere questo eccellente thread CV: esiste una versione di esempio della disuguaglianza di Chebeshev unilaterale?
gung - Ripristina Monica

Inoltre, probabilmente non dovresti accontentarti di Chebyshev subito: puoi probabilmente fare molto meglio, inclinato o no.
Steve S,

1
@gung così fa la regola 68-95-99.7!
Glen_b

Risposte:


12

La deviazione standard è una misura particolare della variazione. Ce ne sono molti altri, Deviazione assoluta media è abbastanza popolare. La deviazione standard non è affatto speciale. Ciò che lo rende speciale è che la distribuzione gaussiana è speciale.

Come sottolineato nei commenti, la disuguaglianza di Chebyshev è utile per farsi un'idea. Tuttavia ce ne sono altri .


9

È la radice quadrata del secondo momento centrale , la varianza. I momenti sono correlati alle funzioni caratteristiche (CF), che sono chiamate caratteristiche per un motivo che definiscono la distribuzione di probabilità. Quindi, se conosci tutti i momenti, conosci CF, quindi conosci l'intera distribuzione di probabilità.

La funzione caratteristica della distribuzione normale è definita da due soli momenti: media e varianza (o deviazione standard). Pertanto, per una distribuzione normale la deviazione standard è particolarmente importante, in un certo senso è il 50% della sua definizione.

Per altre distribuzioni la deviazione standard è in qualche modo meno importante perché hanno altri momenti. Tuttavia, per molte distribuzioni utilizzate nella pratica i primi momenti sono i più grandi, quindi sono i più importanti da sapere.

Ora, intuitivamente, la media ti dice dove si trova il centro della tua distribuzione, mentre la deviazione standard ti dice quanto sono vicini a questo centro i tuoi dati.

Poiché la deviazione standard è nelle unità della variabile, viene anche utilizzata per ridimensionare altri momenti per ottenere misure come la curtosi . La kurtosi è una metrica senza dimensioni che ti dice quanto sono grasse le code della tua distribuzione rispetto alla normale


1
"Ora, intuitivamente, la media ti dice dove si trova il centro della tua distribuzione, mentre la deviazione standard ti dice quanto sono vicini a questo centro i tuoi dati." - Questo non vale solo se la distribuzione è normale? Altrimenti, il più delle volte, la mediana è una misura migliore della tendenza centrale.
Dan Temkin,

@DanTemkin Quando si utilizza la mediana, la deviazione standard perde il suo valore fino a un certo punto. È calcolato fuori dalla media. Con la mediana allora ha senso parlare di quantili, che potrebbe essere un modo per andare con distribuzioni distorte. Tuttavia, OP non si è concentrato su distribuzioni distorte. Quindi, per qualsiasi distribuzione simmetrica hai media = mediana, non ha la parte superiore normale. Quindi ha senso parlare di media quando si discute della deviazione standard.
Aksakal,

4

La deviazione standard del campione è una misura della deviazione dei valori osservati dalla media, nelle stesse unità per misurare i dati. Distribuzione normale o no.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.