Perché la curtosi di una distribuzione normale è 3 anziché 0


18

Cosa si intende con l'affermazione che la curtosi di una distribuzione normale è 3. Significa che sulla linea orizzontale, il valore di 3 corrisponde alla probabilità di picco, ovvero 3 è la modalità del sistema?

Quando guardo una curva normale, sembra che il picco si verifichi al centro, ovvero a 0. Quindi perché la curtosi non è 0 e invece 3?


6
Come scrive @Glen_b, il coefficiente "kurtosis" è stato definito come il quarto momento standardizzato: Succede così per la distribuzione normale, quindi . La curtosi in eccesso generalmente indicata con è . Bisogna fare attenzione perché a volte gli autori scrivono "kurtosi" e significano "eccesso di curtosi". μ4=3σ4β2=3
β2=E[(X-μ)4](E[(X-μ)2])2=μ4σ4
μ4=3σ4β2=3γ 2 = β 2 ( Normale ) - 3γ2γ2=β2(Normale)-3
Alecos Papadopoulos,

1
Ri: Il mio commento precedente. L'espressione corretta per il coefficiente di curtosi in eccesso è
γ2=β2-β2(Normale)=β2-3
Alecos Papadopoulos

Risposte:


29

Curtosi è certamente non è la posizione in cui il picco è. Come dici tu, questa è già chiamata la modalità.

La curtosi è il quarto momento standardizzato: se , è una versione standardizzata della variabile che stiamo osservando, quindi la curtosi della popolazione è la quarta potenza media di quella variabile standardizzata; E(Z4). La curtosi del campione è corrispondentemente correlata alla quarta potenza media di un insieme standardizzato di valori del campione (in alcuni casi è ridimensionato di un fattore che va a 1 in campioni di grandi dimensioni).Z=X-μσE(Z4)

Come notate, questo quarto momento standardizzato è 3 nel caso di una normale variabile casuale. Come osserva Alecos nei commenti, alcune persone definiscono la curtosi come ; questo è talvolta chiamato eccesso di curtosi (è anche il quarto cumulativo). Quando vedi la parola "curtosi" devi tenere presente questa possibilità che persone diverse usano la stessa parola per riferirsi a due quantità diverse (ma strettamente correlate).E(Z4)-3

La kurtosi è di solito descritta come picco di picco * (diciamo quanto sia acutamente curvo il picco - che era presumibilmente l'intenzione di scegliere la parola "curtosi") o la coda pesante (spesso ciò che le persone sono interessate a usarlo per misurare), ma in in realtà il solito quarto momento standardizzato non misura affatto nessuna di queste cose.

In effetti, il primo volume di Kendall e Stuart fornisce controesempi che mostrano che una curtosi più elevata non è necessariamente associata a un picco più alto (in una variabile standardizzata) o a code più larghe (in modo piuttosto simile che il terzo momento non misura esattamente ciò che molte persone pensa di si).

Tuttavia in molte situazioni c'è una certa tendenza ad essere associati ad entrambi, in quanto un picco maggiore e una forte coda spesso tendono ad essere visti quando la curtosi è più alta - dovremmo semplicemente fare attenzione pensando che sia necessariamente il caso.

Kurtosi e asimmetria sono fortemente correlate (la curtosi deve essere almeno 1 in più rispetto al quadrato dell'asimmetria; l'interpretazione della curtosi è un po 'più semplice quando la distribuzione è quasi simmetrica.

inserisci qui la descrizione dell'immagine

Darlington (1970) e Moors (1986) hanno mostrato che la misura del kurtosis del quarto momento è in effetti la variabilità delle "spalle" - , e Balanda e MacGillivray (1988) suggeriscono di pensarla in termini vaghi relativi a quel senso (e considera alcuni altri modi per misurarlo). Se la distribuzione è strettamente concentrata su , allora la curtosi è (necessariamente) piccola, mentre se la distribuzione è diffusa lontano da (che tenderà ad accumularla simultaneamente al centro e spostare la probabilità nelle code per allontanarla dalle spalle), la curtosi del quarto momento sarà grande.μ±σμ±σμ±σ

De Carlo (1997) è un ragionevole punto di partenza (dopo risorse più basilari come Wikipedia) per leggere sulla curtosi.

Modifica: vedo alcune domande occasionali sul fatto che un picco più elevato (valori vicino a 0) possa influenzare affatto la curtosi. La risposta è sì, sicuramente può. Che questo sia il caso è una conseguenza del fatto che è il quarto momento di una variabile standardizzata - per aumentare il quarto momento di una variabile standardizzata è necessario aumentare mantenendo costante . Ciò significa che il movimento di probabilità più avanti nella coda deve essere accompagnato da qualche ulteriore in (interno ); e viceversa - se metti più peso al centro tenendo la varianza a 1, ne metti anche un po 'in coda.E(Z4)E(Z2) (-1,1)

[NB come discusso nei commenti questo non è corretto come una dichiarazione generale; una dichiarazione un po 'diversa è richiesta qui.]

Questo effetto della variazione mantenuta costante è direttamente collegato alla discussione sulla curtosi come "variazione sulle spalle" nei documenti di Darlington e Moors. Quel risultato non è una nozione di handwavy, ma una semplice equivalenza matematica - non si può ritenere che sia altrimenti senza travisare la curtosi.

Ora è possibile aumentare la probabilità all'interno senza alzare il picco. Allo stesso modo, è possibile aumentare la probabilità all'esterno senza necessariamente rendere più pesante la coda distante (ad esempio, con un tipico indice di coda). Cioè, è abbastanza possibile aumentare la curtosi mentre rende la coda più leggera (ad esempio avere una coda più leggera oltre 2 sds su entrambi i lati della media, diciamo).(-1,1)(-1,1)

[La mia inclusione di Kendall e Stuart nei riferimenti è dovuta al fatto che anche la loro discussione sulla curtosi è rilevante a questo punto.]

Quindi cosa possiamo dire? La kurtosi è spesso associata a un picco più elevato e a una coda più pesante, senza che si debba verificare nemmeno appassire. Certamente è più facile sollevare la kurtosi giocando con la coda (poiché è possibile ottenere più di 1 s di distanza), quindi regolando il centro per mantenere costante la varianza, ma ciò non significa che il picco non abbia alcun impatto; lo fa sicuramente, e si può manipolare la curtosi concentrandosi invece su di essa. La curtosi è in gran parte, ma non solo, associata alla pesantezza della coda: di nuovo, guarda alla variazione del risultato delle spalle; semmai questo è ciò che la curtosi sta guardando, in un inevitabile senso matematico.

Riferimenti

Balanda, KP e MacGillivray, HL (1988),
"Kurtosis: una recensione critica".
Statistico americano 42 , 111-119.

Darlington, Richard B. (1970),
"Kurtosis è davvero" Peakedness? "."
Statistico americano 24 , 19-22.

Moors, JJA (1986),
"Il significato della curtosi: Darlington riesaminato".
Statistico americano 40 , 283-284.

DeCarlo, LT (1997),
"Sul significato e l'uso della curtosi".
Psychol. Metodi, 2 , 292-307.

Kendall, MG e A. Stuart,
The Advanced Theory of Statistics ,
Vol. 1, 3a ed.
(le edizioni più recenti hanno Stuart e Ord)


03

1
L'articolo di Westfall sulla curtosi, intitolato Kurtosis come Peakedness, PIR 1905-2014 merita di essere preso in considerazione. Critica DeCarlo (tra gli altri anche elencati sopra) per diffondere la conoscenza della curtosi come misura di picco Collegamento qui: ncbi.nlm.nih.gov/pmc/articles/PMC4321753
Lil'Lobster

1
@Lil Penso che Westfall esageri il suo caso. Concentrandosi (quasi) interamente su code pesanti, è strettamente sbagliato. Mentre la kurtosi è associata in modo abbastanza forte a code pesanti, la kurtosi non è evidentemente una coda pesante (i controesempi in cui le code più pesanti vanno con la curtosi inferiore sono facili da trovare, come è coperto in alcuni dei riferimenti sopra; sono anche facili da fare). La curtosi è associata in modo meno forte al picco ma c'è ancora un'associazione lì; insistendo sul fatto che non è un picco, si spinge troppo oltre nelle sue critiche (critiche simili si applicano alle sue conclusioni). ... ctd
Glen_b -Restate Monica

1
Glen_b, entrambi amiamo la matematica. Se mi criticherai per "aver sopravvalutato il mio caso", per favore, dammi il tuo argomento matematico che collega la curtosi di Pearson con il "picco".
Peter Westfall,

1
Gelen_b, il tuo commento "Questo significa che il movimento di probabilità più in là nella coda deve essere accompagnato da un po 'più dentro mu + - sigma e viceversa - se metti più peso al centro tenendo la varianza a 1, metti anche un po' di nella coda "È falso. Non deve. Puoi mantenere la probabilità (in effetti l'intera distribuzione) all'interno di mu + - sigma costante e aumentare la curtosi all'infinito all'interno di certe famiglie parametriche di distribuzioni. Vedi qui: math.stackexchange.com/questions/167656/…
Peter Westfall

2

Ecco una visualizzazione diretta per capire a cosa si riferisce il numero "3" per quanto riguarda la curtosi della distribuzione normale.

XZ=(X-μ)/σV=Z4VpV(v)

XpV(v)

XpV(v)XpV(v)X

pV(v)

Da questo punto di vista, l'interpretazione essenzialmente corretta del "peso della coda" della curtosi potrebbe essere più specificamente definita come "leva della coda" per evitare di confondere "aumento del peso della coda" con "aumento della massa nella coda". Dopotutto, è possibile che una curtosi più elevata corrisponda a una massa inferiore nella coda, ma dove questa massa ridotta occupa una posizione più distante.

"Dammi il posto dove stare e io sposterò la terra." -Archimedes

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.