Una normale divisa per ti dà una distribuzione t - prova


10

lascia che e .ZN(0,1)Wχ2(s)

Se e sono distribuiti indipendentemente, la variabile segue una distribuzione con gradi di libertà .ZWY=ZW/sts

Sto cercando una prova di questo fatto, un riferimento è abbastanza buono se non si desidera scrivere l'argomento completo.


1
Ciò è dimostrato formalmente su stats.stackexchange.com/questions/52906 : il rapporto, quando scritto come integrale, è visto come una miscela di gaussiani, e quella dimostrazione mostra che la miscela è in distribuzione.
whuber

In alcuni libri di testo questa è una definizione di una distribuzione t. Non è necessario provarlo. Come ricavare un pdf data una tale definizione è comunque una domanda valida.
mpiktas,

Risposte:


12

Sia una variabile casuale chi-quadro con gradi di libertà. Quindi la radice quadrata di , viene distribuita come distribuzione chi con gradi di libertà, che ha densità n YnY n f Y ( y ) = 2 1 - nYY^n

(1)fY^(y^)=21n2Γ(n2)y^n1exp{y^22}

Definire . Quindi , e con la formula del cambio di variabile abbiamo quello YX1nY^Y^X=n

fX(x)=fY^(nx)|Y^X|=21n2Γ(n2)(nx)n1exp{(nx)22}n

(2)=21n2Γ(n2)nn2xn1exp{n2x2}

Sia una normale variabile casuale standard, indipendente dalle precedenti, e definisce la variabile casualeZ

T=ZYn=ZX
.

Dalla formula standard per la funzione di densità del rapporto di due variabili casuali indipendenti,

fT(t)=|x|fZ(xt)fX(x)dx

Ma per l'intervallo perché è un valore non negativo quindi possiamo eliminare il valore assoluto e ridurre l'integrale a[ - , 0 ] XfX(x)=0[,0]X

fT(t)=0xfZ(xt)fX(x)dx

=0x12πexp{(xt)22}21n2Γ(n2)nn2xn1exp{n2x2}dx

(3)=12π21n2Γ(n2)nn20xnexp{12(n+t2)x2}dx

L'integrando in sembra promettente di essere eventualmente trasformato in una funzione di densità gamma. I limiti di integrazione sono corretti, quindi è necessario manipolare l'integrando in una funzione di densità gamma senza modificarne i limiti. Definire la variabile(3)

mx2dm=2xdxdx=dm2x,x=m12
Effettuando la sostituzione nell'integrand che abbiamo

(4)I3=0xnexp{12(n+t2)m}dm2x=120mn12exp{12(n+t2)m}dm

La densità gamma può essere scritta

Gamma(m;k,θ)=mk1exp{mθ}θkΓ(k)

Coefficienti di corrispondenza, dobbiamo avere

k1=n12k=n+12,1θ=12(n+t2)θ=2(n+t2)

Per questi valori di e i termini nell'integrando che coinvolgono la variabile sono il nocciolo di una densità gamma. Quindi, se dividiamo l'integrando per e moltiplichiamo all'esterno dell'integrale per la stessa grandezza, l'integrale sarà la gamma dist. funzione e eguaglierà l'unità. Quindi siamo arrivati ​​aθ ( θ ) k Γ ( k )kθ(θ)kΓ(k)

I3=12(θ)kΓ(k)=12(2n+t2)n+12Γ(n+12)=2n12nn+12Γ(n+12)(1+t2n)12(n+1)

Inserendo quanto sopra in eq. otteniamo(3)

fT(t)=12π21n2Γ(n2)nn22n12nn+12Γ(n+12)(1+t2n)12(n+1)

=Γ[(n+1)/2]nπΓ(n/2)(1+t2n)12(n+1)

... che è quella che viene chiamata la (funzione di densità della) distribuzione t di Student, con gradi di libertà.n


23

Sebbene a ES Pearson non piacesse, l'argomentazione originale di Fisher era geometrica, semplice, convincente e rigorosa. Si basa su un numero limitato di fatti intuitivi e facilmente dimostrabili. Sono facilmente visualizzati quando o , dove la geometria può essere visualizzata in due o tre dimensioni. In effetti, equivale a usare coordinate cilindriche in per analizzare variabili normali.s=1s=2Rs×Rs+1

  1. s+1 variate normali indipendenti e identicamente distribuite sono sfericamente simmetrici. Ciò significa che la proiezione radiale del punto sulla sfera unitaria ha una distribuzione uniforme su .X1,,Xs+1(X1,,Xs+1)SsRs+1 S sSs

  2. Un di distribuzione è quello della somma dei quadrati dei indipendente normale standard variates.χ2(s)s

  3. Pertanto, impostando e , il rapporto è la tangente della latitudine del punto in .Z=Xs+1W=X12++Xs2Z/Wθ(X1,,Xs,Xs+1)Rs+1

  4. tanθ è invariato dalla proiezione radiale su .Ss

  5. L'insieme determinato da tutti i punti di latitudine su è una sfera dimensionale del raggio . La sua misura dimensionale è quindi proporzionale aθSss1cosθs1

    coss1θ=(1+tan2θ)(s1)/2.

  6. L'elemento differenziale è .d(tanθ)=cos2θdθ=(1+tan2θ)dθ

  7. Scrivere dà , da cui e Insieme, queste equazioni implicanoIncorporando il fattore in una costante normalizzante si mostra che la densità di è proporzionale at=Z/W/s=stanθtanθ=t/s

    1+t2/s=1+tan2θ
    dt=sdtanθ=s(1+tan2θ)dθ.
    dθ=1s(1+t2/s)1dt.
    1/sC(s)t

    (1+tan2θ)(s1)/2dθ=(1+t2/s)(s1)/2 (1+t2/s)1dt=(1+t2/s)(s+1)/2dt.

Questa è la densità di Student t.

figura

La figura raffigura l'emisfero superiore (con ) di in . Gli assi incrociati attraversano il -hyperplane. I punti neri fanno parte di un campione casuale di una distribuzione normale standard : sono i valori che proiettano su una data latitudine costante , mostrata come una banda gialla. La densità di questi punti è proporzionale al volume dimensionale di quella banda, che a sua volta è un di raggio . Il cono sopra quella banda viene disegnato per terminare ad un'altezza di . Fino a un fattore diZ0SsRs+1Ws+1θs1Ss1θtanθs, la distribuzione t di Student con gradi di libertà è la distribuzione di questa altezza ponderata dalla misura della banda gialla al momento di normalizzare l'area della sfera unitaria all'unità.sSs

Per inciso, la costante di normalizzazione deve essere (come precedentemente menzionato) volte i volumi relativi delle sfere ,1/s

C(s)=1s|Ss1||Ss|=1ssπs/2Γ(s+12+1)(s+1)π(s+1)/2Γ(s2+1)=1ssπs/2(s+1)/2Γ(s+12)(s+1)π(s+1)/2(s/2)Γ(s2)=Γ(s+12)sπΓ(s2).

L'espressione finale, sebbene convenzionale, nasconde leggermente l'espressione iniziale meravigliosamente semplice, che rivela chiaramente il significato di .C(s)


Fisher ha spiegato questa derivazione a WS Gosset (l'originale "Studente") in una lettera. Gosset ha tentato di pubblicarlo, dando pieno credito a Fisher, ma Pearson ha respinto il documento. Il metodo di Fisher, applicato al problema sostanzialmente simile ma più difficile di trovare la distribuzione di un coefficiente di correlazione del campione, fu infine pubblicato.

Riferimenti

RA Fisher, Distribuzione in frequenza dei valori del coefficiente di correlazione nei campioni di una popolazione indefinitamente grande. Biometrika Vol. 10, n. 4 (maggio 1915), pagg. 507-521. Disponibile sul Web all'indirizzo https://stat.duke.edu/courses/Spring05/sta215/lec/Fish1915.pdf (e in molti altri luoghi tramite la ricerca, una volta che questo collegamento scompare).

Joan Fisher Box, Gosset, Fisher e la distribuzione t. The American Statistician , Vol. 35, n. 2 (maggio 1981), pagg. 61-66. Disponibile sul Web all'indirizzo http://social.rollins.edu/wpsites/bio342spr13/files/2015/03/Studentttest.pdf .

EL Lehmann, Fisher, Neyman e la creazione di statistiche classiche. Springer (2011), capitolo 2.


Questa è una prova fantastica! Spero sinceramente che tu trovi questo messaggio, anche se sono passati diversi anni. Nel sesto passaggio di questa prova, credo che ci sia un errore. Cos ^ -2 (theta) = (1 + tan ^ 2 (theta)), non il suo inverso. Pregare c'è una soluzione semplice?
Appassionato di matematica il

@Math Grazie per le tue osservazioni. Non trovo alcun errore al punto 6. Forse stai cercando di leggere " " (che significa la potenza di ) come se significasse " "? cos2(θ)cos ( θ ) ( ArcCos ( θ ) ) 22cos(θ)(ArcCos(θ))2
whuber

1
Ho usato la semplice identità per dedurre che nella riga 5 Ma con questo stesso ragionamento nella riga 6, . Ciò è in conflitto con l'affermazione secondo cui l'elemento differenziale è uguale ac o s θ = ( t un n 2 θ + 1 ) - 1 / 2 c ) - 1sec2θ=tan2θ+1cosθ=(tan2θ+1)1/2( t a n 2 θ + 1cos2θ=sec2θ=(tan2θ+1)(tan2θ+1)1
Appassionato di matematica il

@Math Grazie - hai ragione, ovviamente. Ho modificato i punti (6) e (7) per correggere l'algebra.
whuber

1
Che sollievo! Buone vacanze a te
Appassionato di matematica il

1

Vorrei provare a cambiare le variabili. Impostare e per esempio. Quindi , . Quindi. Dove è la matrice Jacobiana per la funzione multivariata di e di e . Quindi è possibile integrare out dalla densità articolare. , , e X=ZZ=XW=sX2Y=ZWsX=ZZ=X fX,Y(x,y)=fZ,W(x,sx2W=sX2Y2J Z W X Y x fX,Y(X,y)=fZ,W(X,SX2y2)|det(J)|JZWXYXZX=1ZY=0OWX=2SXY2WY=-2SX2Y3 .

J=(10*-2SX2Y3)

Quindi . Ho appena dato un'occhiata a Elementi di Teoria Distribuzione per Thomas A. Severini e là, prendono . L'integrazione delle cose diventa più semplice usando le proprietà di una distribuzione Gaama. Se uso , probabilmente avrei bisogno di completare i quadrati. X=WX=Z|det(J)|=2SX2y3X=WX=Z

Ma non voglio fare il calcolo.


1
Non ti ho votato a fondo, in effetti ti ho appena votato. Ma penso che forse il downvote sia arrivato prima della tua modifica.
Monolite,

Scusami, starò attento da ora in poi.
ztyh
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.