Perché la distribuzione t diventa più normale all'aumentare della dimensione del campione?


19

Come da Wikipedia, capisco che la distribuzione t è la distribuzione campionaria del valore t quando i campioni sono osservati da una popolazione normalmente distribuita. Tuttavia, non capisco intuitivamente il motivo per cui ciò fa sì che la forma della distribuzione a T cambi da coda grassa a quasi perfettamente normale.

Lo capisco se stai campionando da una distribuzione normale, allora se prendi un campione grande assomiglierà a quella distribuzione, ma non capisco perché inizia con la forma a coda grassa che fa.

Risposte:


22

Proverò a dare una spiegazione intuitiva.

La statistica t * ha un numeratore e un denominatore. Ad esempio, la statistica nel test t di un campione è

x¯μ0s/n

* (ce ne sono diversi, ma si spera che questa discussione sia abbastanza generale da coprire quelli di cui stai chiedendo)

In base alle ipotesi, il numeratore ha una distribuzione normale con media 0 e qualche deviazione standard sconosciuta.

Sotto lo stesso insieme di presupposti, il denominatore è una stima della deviazione standard della distribuzione del numeratore (l'errore standard della statistica sul numeratore). È indipendente dal numeratore. Il suo quadrato è una variabile casuale chi-quadrato divisa per i suoi gradi di libertà (che è anche il df della distribuzione t) volte .σnumerator

Quando i gradi di libertà sono piccoli, il denominatore tende ad essere piuttosto distorto. Ha un'alta probabilità di essere inferiore alla sua media e una probabilità relativamente buona di essere piuttosto piccola. Allo stesso tempo, ha anche qualche possibilità di essere molto, molto più grande della sua media.

Sotto il presupposto della normalità, il numeratore e il denominatore sono indipendenti. Quindi, se attingiamo in modo casuale dalla distribuzione di questa statistica t, abbiamo un normale numero casuale diviso per un secondo valore scelto casualmente * da una distribuzione obliqua a destra che è in media intorno a 1.

* indipendentemente dal termine normale

Poiché è sul denominatore, i piccoli valori nella distribuzione del denominatore producono valori t molto grandi. L'inclinazione a destra nel denominatore rende la statistica t dalla coda pesante. La coda destra della distribuzione, quando sul denominatore rende la distribuzione t più nettamente più alta di una normale con la stessa deviazione standard della t .

Tuttavia, man mano che i gradi di libertà diventano grandi, la distribuzione diventa molto più normale e molto più "stretta" attorno alla sua media.

inserisci qui la descrizione dell'immagine

Pertanto, l'effetto della divisione per denominatore sulla forma della distribuzione del numeratore si riduce all'aumentare dei gradi di libertà.

Alla fine - come il teorema di Slutsky potrebbe suggerirci potrebbe accadere - l'effetto del denominatore diventa più simile alla divisione per una costante e la distribuzione della statistica t è molto vicina alla normale.


Considerato in termini di reciprocità del denominatore

whuber ha suggerito nei commenti che potrebbe essere più illuminante guardare il reciproco del denominatore. Cioè, potremmo scrivere le nostre statistiche t come numeratore (normale) volte reciproco di denominatore (inclinazione a destra).

Ad esempio, la nostra statistica di un campione-t sopra sarebbe diventata:

n(x¯μ0)1/s

Consideriamo ora la deviazione standard della popolazione dell'originale , . Possiamo moltiplicare e dividere per esso, in questo modo:Xiσx

n(x¯μ0)/σxσx/s

Il primo termine è normale standard. Il secondo termine (la radice quadrata di una variabile aleatoria chi-quadrata inversa in scala) quindi ridimensiona lo standard normale in base a valori maggiori o minori di 1, "diffondendolo".

Sotto il presupposto della normalità, i due termini nel prodotto sono indipendenti. Quindi, se attingiamo casualmente dalla distribuzione di questa statistica t, abbiamo un normale numero casuale (il primo termine nel prodotto) volte un secondo valore scelto casualmente (indipendentemente dal termine normale) da una distribuzione distorta che è ' in genere "circa 1.

Quando i df sono grandi, il valore tende ad essere molto vicino a 1, ma quando i df sono piccoli, è piuttosto inclinato e la diffusione è grande, con la grande coda destra di questo fattore di ridimensionamento che rende la coda abbastanza grassa:

inserisci qui la descrizione dell'immagine


Grazie! Ciò ha chiarito molto, ma ero ancora un po 'incerto su "Il suo quadrato è una variabile casuale chi-quadrato divisa per i suoi gradi di libertà (che è anche il df della distribuzione t) volte [la deviazione standard del] numeratore ". Lo hai detto solo perché era una cosa utile da sapere o è qualcosa di direttamente pertinente alla risposta alla mia domanda? Capisco che è la distribuzione del denominatore, in contrapposizione alla distribuzione del quadrato del denominatore, che è raffigurata nella tua figura.
user1205901 - Ripristina Monica il

2
La distribuzione della statistica sarebbe più pesante del normale anche se non fosse specificamente la radice quadrata di un chi-quadrato sul suo df; in tal senso non altererebbe direttamente la risposta per lasciarla fuori. Ma almeno serve da spiegazione per la provenienza delle distribuzioni di chi ridimensionate nel diagramma.
Glen_b -Restate Monica

3
Sto pensando che potrebbe essere un po 'più illuminante condurre questa analisi sulla base del reciproco della deviazione standard del campione. Ciò, unito all'argomento secondo cui la SD di esempio è indipendente dalla media del campione (un'idea chiave che trarrebbe beneficio da un po 'più di enfasi e spiegazione, IMHO), aiuterebbe le persone a vedere che la divisione della media del campione dalla SD del campione deve spargere quella che altrimenti sarebbe una distribuzione normale. (Questo ovviamente era il punto centrale della scoperta di Gossett.)
whuber

1
@whuber Ho aggiunto una sezione discutendola in termini di reciproco, ma ho anche mantenuto la discussione originale (mi sembra più diretta, ma apprezzo che molte persone possano trarne di più in termini di reciproco) . Aggiungerò anche un po 'di indipendenza
Glen_b -Restate Monica

1
s/nσ/ns/σσ/sσ

8

@Glen_b ti ha dato l'intuizione sul perché la statistica t appare più normale all'aumentare della dimensione del campione. Ora, ti darò una spiegazione leggermente più tecnica del caso quando avrai già ottenuto la distribuzione della statistica.

n1n

(1+x2n1)n/2n1B(n12,12).

È possibile dimostrarlo

1n1B(n12,12)12π,

e

(1+x2n1)n/2exp(x2/2),

n


2
1/n(1+(x/n)2)1tngradi di libertà? Vuole sapere perché la sequenza "inizia con la forma a coda grassa che fa".
whuber

2
nn

2

Volevo solo condividere qualcosa che ha aiutato la mia intuizione come principiante (anche se è meno rigorosa delle altre risposte).

Z,Z1,...,Zn

ZZ12+...+Zn2n

n

n1Zn

E[Z2]=1nZi2nZi2

nZ1=Z

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.