Proverò a dare una spiegazione intuitiva.
La statistica t * ha un numeratore e un denominatore. Ad esempio, la statistica nel test t di un campione è
x¯−μ0s/n−−√
* (ce ne sono diversi, ma si spera che questa discussione sia abbastanza generale da coprire quelli di cui stai chiedendo)
In base alle ipotesi, il numeratore ha una distribuzione normale con media 0 e qualche deviazione standard sconosciuta.
Sotto lo stesso insieme di presupposti, il denominatore è una stima della deviazione standard della distribuzione del numeratore (l'errore standard della statistica sul numeratore). È indipendente dal numeratore. Il suo quadrato è una variabile casuale chi-quadrato divisa per i suoi gradi di libertà (che è anche il df della distribuzione t) volte .σnumerator
Quando i gradi di libertà sono piccoli, il denominatore tende ad essere piuttosto distorto. Ha un'alta probabilità di essere inferiore alla sua media e una probabilità relativamente buona di essere piuttosto piccola. Allo stesso tempo, ha anche qualche possibilità di essere molto, molto più grande della sua media.
Sotto il presupposto della normalità, il numeratore e il denominatore sono indipendenti. Quindi, se attingiamo in modo casuale dalla distribuzione di questa statistica t, abbiamo un normale numero casuale diviso per un secondo valore scelto casualmente * da una distribuzione obliqua a destra che è in media intorno a 1.
* indipendentemente dal termine normale
Poiché è sul denominatore, i piccoli valori nella distribuzione del denominatore producono valori t molto grandi. L'inclinazione a destra nel denominatore rende la statistica t dalla coda pesante. La coda destra della distribuzione, quando sul denominatore rende la distribuzione t più nettamente più alta di una normale con la stessa deviazione standard della t .
Tuttavia, man mano che i gradi di libertà diventano grandi, la distribuzione diventa molto più normale e molto più "stretta" attorno alla sua media.
Pertanto, l'effetto della divisione per denominatore sulla forma della distribuzione del numeratore si riduce all'aumentare dei gradi di libertà.
Alla fine - come il teorema di Slutsky potrebbe suggerirci potrebbe accadere - l'effetto del denominatore diventa più simile alla divisione per una costante e la distribuzione della statistica t è molto vicina alla normale.
Considerato in termini di reciprocità del denominatore
whuber ha suggerito nei commenti che potrebbe essere più illuminante guardare il reciproco del denominatore. Cioè, potremmo scrivere le nostre statistiche t come numeratore (normale) volte reciproco di denominatore (inclinazione a destra).
Ad esempio, la nostra statistica di un campione-t sopra sarebbe diventata:
n−−√(x¯−μ0)⋅1/s
Consideriamo ora la deviazione standard della popolazione dell'originale , . Possiamo moltiplicare e dividere per esso, in questo modo:Xiσx
n−−√(x¯−μ0)/σx⋅σx/s
Il primo termine è normale standard. Il secondo termine (la radice quadrata di una variabile aleatoria chi-quadrata inversa in scala) quindi ridimensiona lo standard normale in base a valori maggiori o minori di 1, "diffondendolo".
Sotto il presupposto della normalità, i due termini nel prodotto sono indipendenti. Quindi, se attingiamo casualmente dalla distribuzione di questa statistica t, abbiamo un normale numero casuale (il primo termine nel prodotto) volte un secondo valore scelto casualmente (indipendentemente dal termine normale) da una distribuzione distorta che è ' in genere "circa 1.
Quando i df sono grandi, il valore tende ad essere molto vicino a 1, ma quando i df sono piccoli, è piuttosto inclinato e la diffusione è grande, con la grande coda destra di questo fattore di ridimensionamento che rende la coda abbastanza grassa: