La kurtosi misura i valori anomali. I valori anomali sono problematici per le inferenze standard (ad esempio, test t, intervalli t) che si basano sulla distribuzione normale. Questa è la fine della storia! Ed è davvero una storia piuttosto semplice.
Il motivo per cui questa storia non è molto apprezzata è perché persiste l'antico mito secondo cui la curtosi misura il "picco".
Ecco una semplice spiegazione che mostra perché la kurtosi misura i valori anomali e non "il picco".
Considera il seguente set di dati.
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 1
La curtosi è il valore atteso dei (valori z) ^ 4. Ecco i (valori-z) ^ 4:
6.51, 0.30, 5.33, 0.45, 0.00, 0.30, 6.51, 0.00, 0.45, 0.30, 0.00, 6.51, 0.00, 0.00, 0.30, 0.00, 27.90, 0.00, 0.30, 0.45
La media è 2,78 e questa è una stima della curtosi. (Sottrai 3 se vuoi l'eccessiva curtosi.)
Ora, sostituisci l'ultimo valore di dati con 999 in modo che diventi un valore anomalo:
0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999
Ora, ecco i (valori-z) ^ 4:
0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00,0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 0,00, 360,98
La media è di 18,05 e questa è una stima della curtosi. (Sottrai 3 se vuoi l'eccessiva curtosi.)
Chiaramente, contano solo i valori anomali. Nulla riguarda il "picco" o i dati vicino al centro.
Se si eseguono analisi statistiche standard con il secondo set di dati, è necessario prevedere problemi. La grande curtosi ti avvisa del problema.
Ecco un documento che elabora:
Westfall, PH (2014). Kurtosis as Peakedness, 1905 - 2014. RIP The American Statistician, 68, 191–195.