Curtosi è certamente non è la posizione in cui il picco è. Come dici tu, questa è già chiamata la modalità.
La curtosi è il quarto momento standardizzato: se , è una versione standardizzata della variabile che stiamo osservando, quindi la curtosi della popolazione è la quarta potenza media di quella variabile standardizzata; E(Z4). La curtosi del campione è corrispondentemente correlata alla quarta potenza media di un insieme standardizzato di valori del campione (in alcuni casi è ridimensionato di un fattore che va a 1 in campioni di grandi dimensioni).Z= X- μσE( Z4)
Come notate, questo quarto momento standardizzato è 3 nel caso di una normale variabile casuale. Come osserva Alecos nei commenti, alcune persone definiscono la curtosi come ; questo è talvolta chiamato eccesso di curtosi (è anche il quarto cumulativo). Quando vedi la parola "curtosi" devi tenere presente questa possibilità che persone diverse usano la stessa parola per riferirsi a due quantità diverse (ma strettamente correlate).E( Z4) - 3
La kurtosi è di solito descritta come picco di picco * (diciamo quanto sia acutamente curvo il picco - che era presumibilmente l'intenzione di scegliere la parola "curtosi") o la coda pesante (spesso ciò che le persone sono interessate a usarlo per misurare), ma in in realtà il solito quarto momento standardizzato non misura affatto nessuna di queste cose.
In effetti, il primo volume di Kendall e Stuart fornisce controesempi che mostrano che una curtosi più elevata non è necessariamente associata a un picco più alto (in una variabile standardizzata) o a code più larghe (in modo piuttosto simile che il terzo momento non misura esattamente ciò che molte persone pensa di si).
Tuttavia in molte situazioni c'è una certa tendenza ad essere associati ad entrambi, in quanto un picco maggiore e una forte coda spesso tendono ad essere visti quando la curtosi è più alta - dovremmo semplicemente fare attenzione pensando che sia necessariamente il caso.
Kurtosi e asimmetria sono fortemente correlate (la curtosi deve essere almeno 1 in più rispetto al quadrato dell'asimmetria; l'interpretazione della curtosi è un po 'più semplice quando la distribuzione è quasi simmetrica.
Darlington (1970) e Moors (1986) hanno mostrato che la misura del kurtosis del quarto momento è in effetti la variabilità delle "spalle" - , e Balanda e MacGillivray (1988) suggeriscono di pensarla in termini vaghi relativi a quel senso (e considera alcuni altri modi per misurarlo). Se la distribuzione è strettamente concentrata su , allora la curtosi è (necessariamente) piccola, mentre se la distribuzione è diffusa lontano da (che tenderà ad accumularla simultaneamente al centro e spostare la probabilità nelle code per allontanarla dalle spalle), la curtosi del quarto momento sarà grande.μ ± σμ ± σμ ± σ
De Carlo (1997) è un ragionevole punto di partenza (dopo risorse più basilari come Wikipedia) per leggere sulla curtosi.
Modifica: vedo alcune domande occasionali sul fatto che un picco più elevato (valori vicino a 0) possa influenzare affatto la curtosi. La risposta è sì, sicuramente può. Che questo sia il caso è una conseguenza del fatto che è il quarto momento di una variabile standardizzata - per aumentare il quarto momento di una variabile standardizzata è necessario aumentare mantenendo costante . Ciò significa che il movimento di probabilità più avanti nella coda deve essere accompagnato da qualche ulteriore in (interno ); e viceversa - se metti più peso al centro tenendo la varianza a 1, ne metti anche un po 'in coda.E( Z4)E( Z2) ( - 1 , 1 )
[NB come discusso nei commenti questo non è corretto come una dichiarazione generale; una dichiarazione un po 'diversa è richiesta qui.]
Questo effetto della variazione mantenuta costante è direttamente collegato alla discussione sulla curtosi come "variazione sulle spalle" nei documenti di Darlington e Moors. Quel risultato non è una nozione di handwavy, ma una semplice equivalenza matematica - non si può ritenere che sia altrimenti senza travisare la curtosi.
Ora è possibile aumentare la probabilità all'interno senza alzare il picco. Allo stesso modo, è possibile aumentare la probabilità all'esterno senza necessariamente rendere più pesante la coda distante (ad esempio, con un tipico indice di coda). Cioè, è abbastanza possibile aumentare la curtosi mentre rende la coda più leggera (ad esempio avere una coda più leggera oltre 2 sds su entrambi i lati della media, diciamo).( - 1 , 1 )( - 1 , 1 )
[La mia inclusione di Kendall e Stuart nei riferimenti è dovuta al fatto che anche la loro discussione sulla curtosi è rilevante a questo punto.]
Quindi cosa possiamo dire? La kurtosi è spesso associata a un picco più elevato e a una coda più pesante, senza che si debba verificare nemmeno appassire. Certamente è più facile sollevare la kurtosi giocando con la coda (poiché è possibile ottenere più di 1 s di distanza), quindi regolando il centro per mantenere costante la varianza, ma ciò non significa che il picco non abbia alcun impatto; lo fa sicuramente, e si può manipolare la curtosi concentrandosi invece su di essa. La curtosi è in gran parte, ma non solo, associata alla pesantezza della coda: di nuovo, guarda alla variazione del risultato delle spalle; semmai questo è ciò che la curtosi sta guardando, in un inevitabile senso matematico.
Riferimenti
Balanda, KP e MacGillivray, HL (1988),
"Kurtosis: una recensione critica".
Statistico americano 42 , 111-119.
Darlington, Richard B. (1970),
"Kurtosis è davvero" Peakedness? "."
Statistico americano 24 , 19-22.
Moors, JJA (1986),
"Il significato della curtosi: Darlington riesaminato".
Statistico americano 40 , 283-284.
DeCarlo, LT (1997),
"Sul significato e l'uso della curtosi".
Psychol. Metodi, 2 , 292-307.
Kendall, MG e A. Stuart,
The Advanced Theory of Statistics ,
Vol. 1, 3a ed.
(le edizioni più recenti hanno Stuart e Ord)