Perché il test di indipendenza utilizza la distribuzione chi-quadro?


12

Il test di bontà di adattamento utilizza la seguente statistica : χ 2 0 = n i = 1 ( O i - E i ) 2χ2 Nel test, garantendo che le condizioni sono soddisfatte, si usa il×2-distribuzioneper calcolare il valore p che, data l'H0è vera osserverebbe tale valore in un campione rappresentativo delle stesse dimensioni.

χ02=i=1n(OiEi)2Ei
χ2H0

Tuttavia, affinché una statistica segua una distribuzione χ 2 (con n - 1 gradi di libertà), deve essere vero che: n i = 1 ( O i - E i ) 2χ02χ2n1 per indipendenti, normale standardZi(Wikipedia). Le condizioni per il test sono le seguenti (di nuovo, daWikipedia):

i=1n(OiEi)2Ei=i=1n1Zi2
Zi
  1. Campione rappresentativo della popolazione
  2. Grande dimensione del campione
  3. Il conteggio delle cellule previsto è sufficientemente grande
  4. Indipendenza tra ogni categoria

EiZi1/2

La necessità di (4) sembra tornare utile in seguito, ma non riesco a vedere come.

Zi=OiEiEiOiEiN(0,Ei)nn1

ZiOiEiEiχ02=i=1n1Zi2Zi

χ02χ2(OiEi)2EiZi2Zi


1
OiEiN(0,Ei)χ2χ2χ2χ2

1
Dall'uguaglianza di due somme di quadrati non è possibile concludere che le radici quadrate sono uguali termine per termine! Poiché questo è il caso dei semplici numeri, lo è sicuramente anche delle variabili casuali.
whuber

1
(Wi),i=1,,nχν1,ν2,,νnν1+ν2++νn=n1νi1iWii=1nWi2χ2(n1)

1
n1n

1
n

Risposte:


6

XλXλ

(Xλ)2λ
z2

z2

izi2=ZIZ

ZQZ
Q

i(ziz¯)2

Mi dispiace, ma mi hai sicuramente perso a "Se invece, lo fai ..."
VF1

@ VF1, ho apportato una modifica, quindi spero sia più chiaro. Il teorema di Cochrane è la risposta alla tua domanda su quando una somma di quadrati con normali ha una distribuzione chi-quadrata.
Placidia,

1
OK, darò un'occhiata a questo. Lascerò aperta la domanda, comunque, nel caso in cui qualcun altro abbia qualcosa da aggiungere.
VF1

1
Normalmente la dimensione del campione è fissa. Ciò significa che è impossibile che una qualsiasi delle voci possa seguire una distribuzione di Poisson. L'appello a una distribuzione di Poisson sembra quindi che sia solo un'altra approssimazione - e sembra lasciarci proprio dove abbiamo iniziato.
whuber

1

χ2

Zi=OiEiEi

OiEi(StandardErrorOfTheObserved)

(StandardErrorOfTheObserved)EiZi=OiEiEi

Ad ogni modo, è possibile creare una statistica di prova del modulo

Z=|Z1|+|Z2|+|Z3|+...

χ2=Z12+Z22+Z32+...

χ2χ2

χ2

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.