Tendenza, diffusione e asimmetria centrali possono essere tutte definite relativamente bene, almeno su base intuitiva; le misure matematiche standard di queste cose corrispondono anche relativamente bene alle nostre nozioni intuitive. Ma la curtosi sembra essere diversa. È molto confuso e non si abbina bene con alcuna intuizione sulla forma distributiva.
Una spiegazione tipica della curtosi in un'impostazione applicata sarebbe questo estratto dalle statistiche applicate per le imprese e la gestione utilizzando Microsoft Excel [ 1 ] :
La curtosi si riferisce a quanto è alta una distribuzione o viceversa a quanto è piatta. Se ci sono più valori di dati nelle code, di quello che ti aspetti da una distribuzione normale, la curtosi è positiva. Al contrario, se ci sono meno valori di dati nelle code, di quanto ci si aspetterebbe in una distribuzione normale, la curtosi è negativa. Excel non può calcolare questa statistica a meno che tu non abbia almeno quattro valori di dati.
A parte la confusione tra "kurtosi" e "eccesso di curtosi" (come in questo libro, è comune usare la prima parola per riferirsi a ciò che gli altri autori chiamano quest'ultima), l'interpretazione in termini di "picco" o "piattezza" viene quindi confuso dal passaggio di attenzione a quanti elementi di dati sono nelle code. Considerando sia "picco" e "code" è necessario - Kaplansky [ 2 ]si lamentò nel 1945 che molti libri di testo dell'epoca affermavano erroneamente che la curtosi aveva a che fare con quanto il picco della distribuzione fosse elevato rispetto a quello di una distribuzione normale, senza considerare le code. Ma chiaramente il fatto di considerare la forma sia in cima che in coda rende l'intuizione più difficile da cogliere, un punto su cui l'estratto sopra citato salta passando dal picco alla pesantezza delle code come se questi concetti fossero gli stessi.
Inoltre questa classica spiegazione "picco e croce" della curtosi funziona bene solo per distribuzioni simmetriche e unimodali (in effetti, gli esempi illustrati in quel testo sono tutti simmetrici). Tuttavia, il modo generale "corretto" di interpretare la curtosi, sia in termini di "picchi", "code" o "spalle", è stato contestato per decenni . [ 2 ] [ 3 ] [ 4 ] [ 5 ] [ 6 ]
Esiste un modo intuitivo di insegnare la curtosi in un contesto applicato che non colpirà contraddizioni o controesempi quando verrà adottato un approccio più rigoroso? La kurtosi è addirittura un concetto utile nel contesto di questo tipo di corsi di analisi dei dati applicati, a differenza delle lezioni di statistica matematica? Se il "picco" di una distribuzione è un concetto intuitivamente utile, dovremmo invece insegnarlo tramite L-moment [ 7 ] ?
Herkenhoff, L. e Fogli, J. (2013). Statistiche applicate per affari e gestione tramite Microsoft Excel. New York, NY: Springer.
Kaplansky, I. (1945). "Un errore comune riguardo alla curtosi". Journal of American Statistical Association,40(230): 259.
Darlington, Richard B (1970). "La Kurtosis è davvero 'Peakedness'?". The American Statistician24(2): 19–22
Moors, JJA. (1986) "Il significato della curtosi: Darlington riesaminato". The American Statistician40(4): 283–284
Balanda, Kevin P. e MacGillivray, HL (1988). "Kurtosis: una recensione critica". The American Statistician 42(2): 111-119
DeCarlo, LT (1997). "Sul significato e l'uso della curtosi". Metodi psicologici,2(3), 292. Chicago
Hosking, JRM (1992). "Momenti o momenti L? Un esempio che confronta due misure della forma distributiva". The American Statistician46(3): 186–189