Il link in questione parla anche di SAS. Ma in realtà nulla in questa domanda, tranne forse il focus del poster, lo limita a quei programmi con un nome particolare.
Penso che qui dobbiamo separare tipi di problemi abbastanza diversi, alcuni dei quali sono illusori e altri autentici.
Alcuni programmi lo fanno e altri no sottraendo 3 in modo che la misura della curtosi riportata sia 3 per le variabili gaussiane / normali senza sottrazione e 0 con sottrazione. Ho visto persone perplesse da questo, spesso quando la differenza risulta essere 2.999 e non esattamente 3.
Alcuni programmi utilizzano fattori di correzione progettati per garantire che la curtosi sia stimata senza distorsioni. Questi fattori di correzione si avvicinano a 1 man mano che la dimensione del campione aumenta. Dato che la curtosi non è ancora ben stimata in piccoli campioni, ciò non dovrebbe destare molta preoccupazione.n
Quindi, c'è un piccolo problema di formule, il n. 1 è un affare molto più grande del n. 2, ma entrambi minori se compresi. Il consiglio è chiaramente quello di consultare la documentazione per il programma che stai usando e se non c'è documentazione che spieghi quel tipo di dettagli per abbandonare immediatamente quel programma. Ma un caso di test semplice come una variabile (1, 2) produce una curtosi di 1 o 4 a seconda del solo # 1 (senza fattore di correzione).
La domanda si pone quindi sull'interpretazione, ma questa è una questione molto più aperta e controversa.
Prima di arrivare all'area di discussione principale, una difficoltà spesso segnalata ma poco nota è che le stime della curtosi sono limitate in funzione della dimensione del campione. Ho scritto una recensione su Cox, New Jersey 2010. I limiti dell'asimmetria del campione e della curtosi. Stata Journal 10 (3): 482-495. http://www.stata-journal.com/article.html?article=st0204
Riassunto: l'asimmetria e la curtosi del campione sono limitate dalle funzioni della dimensione del campione. I limiti, o approssimazioni ad essi, sono stati ripetutamente riscoperti negli ultimi decenni, ma tuttavia sembrano rimanere solo poco conosciuti. I limiti impartiscono distorsioni alla stima e, in casi estremi, implicano che nessun campione è in grado di testimoniare esattamente la sua distribuzione madre. I risultati principali sono spiegati in una revisione del tutorial e viene mostrato come Stata e Mata possono essere usati per confermare ed esplorare le loro conseguenze.
Ora quello che è comunemente considerato il nocciolo della questione:
Molte persone traducono la curtosi come picco, ma altri sottolineano che spesso funge da misura del peso della coda. In effetti, le due interpretazioni potrebbero essere entrambe una formulazione ragionevole per alcune distribuzioni. È quasi inevitabile che non ci sia una semplice interpretazione verbale della kurtosi: il nostro linguaggio non è abbastanza ricco per il confronto di somme di quarto potere di deviazione dalla media e somme di secondo potere della stessa.
In un classico minore e spesso trascurato, Irving Kaplansky (1945a) ha attirato l'attenzione su quattro esempi di distribuzioni con diversi valori di curtosi e comportamento non coerenti con alcune discussioni sulla curtosi.
Xc = π--√
( 1 ) ( 1 / 3 c ) ( 9 / 4 + x 4) exp( - x2)
( 2 ) ( 3 / ( c 8 -√) ) exp( - x2/ 2)-(1 / 6c)(9 / 4+ x4) exp( - x2)
( 3 ) ( 1 / 6 c ) ( exp ( - x2/ 4)+4exp( - x2) )
( 4 ) ( 3 3 -√/ 16c)(2+ x2) exp( - 3 x2/ 4)
≈
È istruttivo tracciare queste densità. Gli utenti Stata possono scaricare il mio kaplansky
programma da SSC. L'uso di una scala logaritmica per la densità può aiutare.
Senza rivelare tutti i dettagli, questi esempi minano qualsiasi semplice storia secondo cui la curtosi bassa o alta ha una chiara interpretazione in termini di picco o di qualsiasi altro singolo contrasto.
Se il nome Irving Kaplansky suona un campanello, probabilmente è perché conosci il suo lavoro nella moderna algebra. Lui (1917-2006) fu un matematico canadese (poi americano) e insegnò e studiò ad Harvard, Chicago e Berkeley, con un anno di guerra nel gruppo di matematica applicata del National Defense Council della Columbia University. Kaplansky apportò importanti contributi alla teoria dei gruppi, alla teoria degli anelli, alla teoria delle algebre degli operatori e alla teoria dei campi. Era un abile pianista e paroliere e un entusiasta e lucido espositore di matematica. Nota anche alcuni altri contributi alla probabilità e alle statistiche di Kaplansky (1943, 1945b) e Kaplansky e Riordan (1945).
Kaplansky, I. 1943. Una caratterizzazione della distribuzione normale. Annali delle statistiche matematiche 14: 197-198.
Kaplansky, I. 1945a. Un errore comune riguardo alla curtosi. Diario, solo American Statistical Association 40: 259.
Kaplansky, I. 1945b. La distribuzione asintotica di corse di elementi consecutivi. Annali delle statistiche matematiche 16: 200-203.
Kaplansky, I. e Riordan, J. 1945. Corrispondenza multipla e corse con il metodo simbolico. Annali delle statistiche matematiche 16: 272-277.