Espressione in forma chiusa per la distribuzione della curtosi campionaria della distribuzione gaussiana


10

Esiste un'espressione a forma chiusa per la distribuzione della Kurtosi campionaria dei dati campionati dalla distribuzione gaussiana? vale a dire,

P(K^<a) dove è la kurtosi del campione.K^


2
La kurtosi del campione è data da espressioni in forma chiusa; ci sono formule diverse, ma non ho mai visto quello da usare dipende dalla distribuzione che pensi di avere. Forse vuoi dire che esiste un'espressione a forma chiusa per la funzione di densità di probabilità della curtosi quando si preleva da un gaussiano?
Nick Cox,

Mi dispiace terribilmente, intendo la distribuzione della kurtosi del campione, non la stessa kurtosi del campione.
Yoki,

Grazie per il chiarimento. Più banalmente, vedi ad esempio meta.stats.stackexchange.com/questions/1479/… in quanto non c'è bisogno di ringraziare le persone, ecc. Fai solo la domanda!
Nick Cox,

Risposte:


11

L'esatta distribuzione del campionamento è difficile da derivare; ci sono stati i primi momenti (risalenti al 1929), varie approssimazioni (risalenti ai primi anni '60) e tabelle, spesso basate sulla simulazione (risalenti agli anni '60).

Per essere più specifici:

Fisher (1929) fornisce momenti della distribuzione campionaria dell'asimmetria e della curtosi in campioni normali, e Pearson (1930) (anche) fornisce i primi quattro momenti della distribuzione campionaria dell'asimmetria e della curtosi e propone test basati su di essi.

Quindi ad esempio :

E(b2)=3(n1)n+1

Var(b2)=24n(n2)(n3)(n+1)2(n+3)(n+5)

L' di èb2216n(129n+519n27637n3+)

L'eccesso di curtosi di è .b2540n20196n2+470412n3+

* Attenzione: i valori per i momenti e così via dipendono dalla definizione esatta della kurtosi campione utilizzata. Se vedi una formula diversa per o , ad esempio, sarà generalmente a causa di una definizione leggermente diversa di kurtosi del campione.E(b2)Var(b2)

In questo caso, le formule sopra dovrebbero applicarsi a .b2=ni(XiX¯)4(i(XiX¯)2)2

Pearson (1963) discute dell'approssimazione della distribuzione campionaria della curtosi in campioni normali mediante una distribuzione Pearson di tipo IV o Johnson (senza dubbio il motivo per cui i primi quattro momenti furono dati tre decenni prima era in gran parte possibile per utilizzare la famiglia Pearson) .SU

Pearson (1965) fornisce tabelle per percentili di curtosi per alcuni valori di .n

D'Agostino e Tietjen (1971) forniscono tabelle più ampie di percentili per curtosi.

D'Agostino e Pearson (1973) forniscono grafici dei punti percentuali di curtosi che coprono nuovamente una gamma più ampia di casi.

Fisher, RA (1929),
"Momenti e momenti del prodotto delle distribuzioni campionarie",
Atti della London Mathematical Society , Serie 2, 30: 199-238.

Pearson, ES, (1930)
"Un ulteriore sviluppo di test per la normalità" ,
Biometrika , 22 (1-2), 239-249.

Pearson, ES (1963)
"Alcuni problemi derivanti dall'approssimazione alle distribuzioni di probabilità, usando i momenti" ,
Biometrika , 50 , 95-112

Pearson, ES (1965)
"Tabelle dei punti percentuali di e in campioni normali: un arrotondamento," Biometrika , 52 , 282-285b1b2

D'Agostino, RB e Tietjen, GL (1971),
"Punti di probabilità di simulazione di per piccoli campioni" , Biometrika , 58 , 669-672.b2

D'Agostino, RB e Pearson, ES (1973),
"Test per allontanarsi dalla normalità. Risultati empirici per la distribuzione di e ," Biometrika , 60 , 613-622.b2b1


6

La kurtosi del campione da un campione normale, è approssimativamente distribuita come una media a media zero con varianza , dove è la dimensione del campione (naturalmente, maggiore è migliore è l'approssimazione. Le espressioni più complicate per la varianza possono essere trovato nella pagina di Wikipedia ). Per campioni gaussiani di piccole dimensioni (<40), i percentili sono stati derivati ​​in questo documento: Lacher, DA (1989). Distribuzione campionaria di asimmetria e curtosi. Chimica clinica, 35 (2), 330-331.n n24/nnn


2
n = 500 n > 1000n deve essere moderatamente grande prima che un'approssimazione normale diventi ragionevole. Le statistiche simulate di curtosi sono distorte in modo affidabile (positivamente) quando ; iniziano a sembrare normali per o giù di lì. n=500n>1000
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.