Intuizione dietro la funzione di densità delle distribuzioni t


12

Sto studiando la distribuzione t di Student e ho iniziato a chiedermi come si deriverebbe la funzione di densità delle distribuzioni t (da wikipedia, http://en.wikipedia.org/wiki/Student%27s_t-distribution ):

f(t)=Γ(v+12)vπΓ(v2)(1+t2v)v+12

dove è il grado di libertà e è la funzione gamma. Qual è l'intuizione di questa funzione? Voglio dire, se guardo la funzione di massa di probabilità della distribuzione binomiale, ha senso per me. Ma la funzione di densità delle distribuzioni t non ha alcun senso per me ... non è affatto intuitiva a prima vista. O l'intuizione è solo che ha una curva a campana e soddisfa i nostri bisogni?ΓvΓ

Grazie per qualsiasi aiuto :)


3
Questa distribuzione ha un'interpretazione geometrica semplice (e carina). Infatti, sebbene Student (1908) abbia inizialmente derivato questa forma del PDF attraverso un'ipotesi intelligente (supportata dalla simulazione Monte-Carlo), Fisher (1920 ca.) la ottenne per prima con un argomento geometrico. L'essenza è che descrive la distribuzione del rapporto dell'altezza di un (punto uniformemente distribuito) sull'atmosfera e il suo raggio (distanza dall'asse): in altre parole, la tangente della sua latitudine. Un account di questo è fornito su evolvedmicrobe.com/Literature/GeometricTDistribution.pdf . ν + 1fν+1
whuber

Risposte:


9

Se hai una variabile casuale normale standard, , e una variabile casuale chi-quadrato con df, alloraQ νZQν

T=Z/Q/ν

ha una distribuzione con df. (Non sono sicuro di cosa sia distribuito , ma non è .)/ Z / Q ttνZ/Qt

La derivazione effettiva è un risultato abbastanza standard. Alecos fa un paio di modi qui .

Per quanto riguarda l'intuizione, non ho un'intuizione particolare per la forma funzionale specifica, ma un certo senso generale della forma può essere ottenuto considerando che la distribuzione chi indipendente (scalata da ) indipendente sul denominatore è giusta storto:ν

inserisci qui la descrizione dell'immagine

La modalità è leggermente inferiore a 1 (ma si avvicina a 1 all'aumentare di df), con qualche possibilità di valori sostanzialmente sopra e sotto 1. La variazione in significa che la varianza di sarà maggiore di quella di . I valori di sostanzialmente sopra 1 porterà ad un -value che è più vicino a 0 di è, mentre quelle sostanzialmente inferiori 1 si tradurrà in una -value che è più lontano dalla 0 di è. tZQ/νtZ tZtZQ/νtZtZ

Tutto ciò significa che valori di saranno (i) più variabili, (ii) relativamente più alti e (iii) più pesanti di quelli normali. All'aumentare di df, si concentra attorno a 1, quindi sarà più vicino alla normale.t tQ/νt

inserisci qui la descrizione dell'immagine

(il 'relativamente più alto picco' si traduce in un picco leggermente più nitido rispetto allo spread, ma la maggiore varianza abbassa il centro verso il basso, il che significa che il picco è leggermente più basso con df inferiore)

Quindi questa è un'intuizione sul perché la sembra così.t


1
Ero un po 'sciatto nella mia spiegazione. Naturalmente era la radice quadrata della variabile casuale distribuita Chi-quadrato divisa per i suoi gradi di libertà.
Analista

@Analista Ho fatto lo stesso da solo, più di una volta.
Glen_b

9

La risposta di Glen è corretta, ma dal punto di vista bayesiano è anche utile pensare alla distribuzione t come una miscela continua di distribuzioni normali con varianze diverse. Puoi trovare la derivazione qui:

Studente t come miscela di gaussiano

Sento che questo approccio aiuta la tua intuizione perché chiarisce come sorge la distribuzione t quando non conosci l'esatta variabilità della tua popolazione.


2
Ho fatto un'animazione della distribuzione t come una miscela di distribuzioni normali qui: sumsar.net/blog/2013/12/t-as-a-mixture-of-normals
Rasmus Bååth
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.