Comprensione del test Chi-quadrato e della distribuzione Chi-quadrato


13

Sto cercando di capire la logica dietro il test chi-quadrato.

Il test Chi-quadrato è . χ2viene quindi confrontato con una distribuzione Chi-quadrata per scoprire un valore p al fine di respingere o meno l'ipotesi nulla. H0: le osservazioni provengono dalla distribuzione che abbiamo usato per creare i nostri valori previsti. Ad esempio, potremmo verificare se la probabilità di ottenereè data dapcome ci aspettiamo. Quindi lanciamo 100 volte e troviamonHe1-nH. Vogliamo confrontare la nostra scoperta con ciò che è previsto (100p). Potremmo anche usare una distribuzione binomiale ma non è questo il punto della domanda ... La domanda è:χ2=(obsexp)2expχ2H0headpnH Heads1nH tails100p

Puoi spiegare perché, sotto l'ipotesi nulla, segue una distribuzione chi-quadrata?(obsexp)2exp

Tutto quello che so sulla distribuzione Chi-quadrato è che la distribuzione Chi-quadrato di grado è la somma della distribuzione normale standard di k quadrato.kk


2
No: questa è un'approssimazione. (Molto) di più su questo appare nel thread su stats.stackexchange.com/questions/16921/… .
whuber

Ciò può dimostrare interesse per Karl Pearson e il Chi-squared Test, (Placket, 1983) {pdf}
Avraham,

Una domanda correlata sul perché la distribuzione chi-quadro viene utilizzata per i test di bontà di adattamento, anche se non del tutto un duplicato: stats.stackexchange.com/questions/125312/…
Silverfish

Risposte:


12

Potremmo anche usare una distribuzione binomiale ma non è questo il punto della domanda ...

Tuttavia, è il nostro punto di partenza anche per la tua vera domanda. Lo tratterò in modo un po 'informale.

Consideriamo più in generale il caso binomiale:

YBin(n,p)

npYmin(np,n(1p))np(1p)

Quindi sarà approssimativamente . Qui è il numero di successi.(YE(Y))2/Var(Y)χ12Y

Abbiamo e .E(Y)=npVar(Y)=np(1p)

(Nel caso di test, è noto e è specificato in . Non facciamo alcuna stima.)npH0

Quindi sarà approssimativamente .(Ynp)2/np(1p)χ12

Si noti che . Si noti inoltre che .(Ynp)2=[(nY)n(1p)]21p+11p=1p(1p)

Quindi(Ynp)2np(1p)=(Ynp)2np+(Ynp)2n(1p)=(Ynp)2np+[(nY)n(1p)]2n(1p)=(OSES)2ES+(OFEF)2EF

Che è solo la statistica chi-quadro per il caso binomiale.

Quindi in quel caso la statistica chi-quadro dovrebbe avere la distribuzione del quadrato di una variabile casuale (approssimativamente) normale-normale.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.