Test chi quadrato a due campioni


10

Questa domanda è tratta dal libro di Van der Vaart Asymptotic Statistics, pag. 253. # 3:

Supponiamo che e siano vettori multinomiali indipendenti con parametri e . Sotto l'ipotesi nulla che mostriXmYn(m,a1,,ak)(n,b1,,bk)ai=bi

i=1k(Xm,imc^i)2mc^i+i=1k(Yn,inc^i)2nc^i
ha distribuzione . dove .c i = ( X m , i + Y n , i ) / ( m + n )χk12c^i=(Xm,i+Yn,i)/(m+n)

Ho bisogno di aiuto per iniziare. Qual è la strategia qui? Sono stato in grado di combinare i due riassunti in:

i=1k(mYn,inXm,i)2mn(m+n)c^i

ma questo non funzionerà con la CLT perché la sua una combinazione ponderata di e . Non sono sicuro che questa sia la strada giusta. Eventuali suggerimenti?Y nXmYn

EDIT: se allora è abbastanza facile perché otteniamom=n

mYnnXmmn(m+n)=YnXm(m+n)

dove il numeratore può essere visto come una somma delle differenze delle variabili multinomiali modo da poter applicare CLT e finire con Teorema 17.2 di quello stesso capitolo. Tuttavia, non riesco a capire come risolverlo in questa situazione con campioni di dimensioni diverse. Qualsiasi aiuto?(1,a1,,ak)

Un link al capitolo 17 di Google Libri di van der Vaart

Risposte:


6

Prima qualche notazione. Lascia che e denoti la sequenza categoriale associata a e , ovvero . Sia . Considera le binerizzazioni dove è il Delta di Kronecker. Quindi abbiamo{ Y t } 1 , , n X m Y nPr { X t =i } =ai,Pr { Y t =i } =biN=n+m X io{Xt}1,,m{Yt}1,,nXmYnPr{Xt=i}=ai,Pr{Yt=i}=biN=n+m

Xi=(X1,i,,XN,i)=(δi,X1,,δi,Xn,0,,0)Yi=(Y1,i,,YN,i)=(0,,0,δi,Y1,,δi,Yn)
δi,j1i=j
Xm,i=t=1NXt,i=t=1mδi,XtYn,i=t=1NYt,i=t=1nδi,Yt

Ora iniziamo la prova. Per prima cosa combiniamo le due somme della statistica test. Nota che Quindi possiamo scrivere la statistica del test come

Xm,imc^i=(n+m)Xm,im(Xm,i+Yn,i)n+m=nXm,imYn,in+mYn,inc^i=(n+m)Yn,in(Xm,i+Yn,i)n+m=mYn,inXm,in+m
S=i=1k(Xm,imc^i)2mc^i+i=1k(Yn,inc^i)2nc^i=i=1k(nXm,imYn,i)2(n+m)2mc^i+i=1k(nXm,imYn,i)2(n+m)2nc^i=i=1k(nXm,imYn,i)2nm(n+m)c^i

La prossima nota che con il seguenti proprietà

nXm,imYn,i=t=1NnXt,imYt,i=Zi
E[Zi]=nE[Xm,i]mE[Yn,i]=nmainmai=0Var[Zi]=Var[nXm,imYn,i]=n2Var[Xm,i]m2Var[Yn,i]Note Xm,i and Yn,i are independent=n2mai(1ai)+m2nai(1ai)=nm(n+m)ai(1ai)Cov[Zi,Zj]=E[ZiZj]E[Zi]E[Zj]=E[(nXm,imYn,i)(nXm,jmYn,j)]=n2(maiaj+m2aiaj)2n2m2aiaj+m2(naiaj+n2aiaj)=nm(n+m)aiaj

e così per CLT multivariato abbiamo dove l' elemento th di , . Poiché Di Slutsky abbiamo dove è la matrice di identità ,(i,j)Σσij=

1nm(n+m)Z=nXmmYnnm(n+m)DN(0,Σ)
(i,j)Σσij=ai(δijaj)c^=(c^1,,c^k)p(a1,,ak)=a
nXmmYnnm(n+m)c^DN(0,Ikaa)
Ikk×ka=(a1,,ak) . Poiché ha autovalore 0 di molteplicità 1 ed autovalore 1 di molteplicità , dal teorema della mappatura continua (o vedi Lemma 17.1, Teorema 17.2 di van der Vaart) abbiamok-1 k i=1(n X m , i -m Y n , i ) 2Ikaak1
i=1k(nXm,imYn,i)2nm(n+m)c^iDχk12
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.