In che modo la statistica Chi Squared di Pearson approssima una distribuzione Chi Squared


10

Quindi, se la statistica Chi Squared di Pearson viene data per una tabella , la sua forma è:1×N

i=1n(OiEi)2Ei

Quindi questo si avvicina , la distribuzione Chi-Squared con n - 1 gradi di libertà, man mano che la dimensione del campione N aumenta. χn12n1N

Quello che non capisco è come funziona questa approssimazione asintotica. Sento che la nei denominatori dovrebbe essere sostituita con la s 2 iEi . Poiché ciò ti darebbeχ 2 n = n i = 1 Z 2 i , perZin(0,1). Ma ovviamente questo hangradi di libertà, nonn-1, quindi chiaramente sta succedendo qualcos'altro.si2niχn2=i=1nZi2Zin(0,1)nn1


Anche se questo non risponde alla tua domanda , potrebbe far luce su di essa.
whuber

Risposte:


11

Lo motiverò in modo intuitivo e indicherò come avviene il caso speciale di due gruppi, supponendo che tu sia felice di accettare la normale approssimazione al binomio.

Spero che ti basti avere un'idea del perché funziona così.

Stai parlando della bontà chi-quadro del test di adattamento. Diciamo che ci sono gruppi (ce l'hai come n , ma c'è una ragione per cui preferisco chiamarlo k ).knk

Nel modello applicati per questa situazione, i conteggi , i = 1 , 2 , . . . , k sono multinomiali .Oii=1,2,...,k

Sia . I conteggi sono condizionati sulla somma N (tranne in alcune situazioni abbastanza rare); e ci sono alcune serie di probabilità prespecificate per ogni categoria, p i , i = 1 , 2 , ... , k , che si sommano a 1 .N=i=1kOiNpi,i=1,2,,k1

Proprio come con il binomio, esiste un'approssimazione normale asintotica per i multinomi - in effetti, se si considera solo il conteggio in una data cella ("in questa categoria" o no), sarebbe quindi binomiale. Proprio come con il binomio, le varianze dei conteggi (così come le loro covarianze nel multinomiale) sono funzioni di e di p ; non si stima una varianza separatamente.Np

Ei=NpiNk1k1Npi(1pi)Npipjk1

Var(Oi)=Npi(1pi)zi=OiEiEi(1pi)ziχk2k1kχk12k1

p1=pp2=1pX=O1NX=O2

XN(Np,Np(1p))z=XNpNp(1p)z2=(XNp)2Np(1p)χ12χ12

Notare che

i=12(OiEi)2Ei=[XNp]2Np+[(NX)(NNp)]2N(1p)=[XNp]2Np+[XNp]2N(1p)=(XNp)2[1Np+1N(1p)]

Ma

1Np+1N(1p)=Np+N(1p)Np.N(1p)=1Np(1p)

i=12(OiEi)2Ei=(XNp)2Np(1p)z2χ12EiEi(1pi)

(OiEi)2Ei(OiEi)2Ei(1pi)kk1

χk12k


Grazie, questo ha senso. È qualcosa di una coincidenza / incidente matematico che funziona così bene da essere semplicemente diviso per il valore atteso? o c'è una spiegazione statistica intuitiva per cui questo dovrebbe essere il caso.
Thoth,

zEi

Eik1

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.