Qual è la relazione tra un test chi quadrato e un test di proporzioni uguali?


52

Supponiamo che io abbia tre popolazioni con quattro caratteristiche reciprocamente esclusive. Prendo campioni casuali da ogni popolazione e costruisco una tabella a campi incrociati o di frequenza per le caratteristiche che sto misurando. Ho ragione nel dire che:

  1. Se volessi verificare se esiste una relazione tra le popolazioni e le caratteristiche (ad esempio se una popolazione ha una frequenza più alta di una delle caratteristiche), dovrei eseguire un test chi-quadrato e vedere se il risultato è significativo.

  2. Se il test del chi-quadrato è significativo, mi mostra solo che esiste una relazione tra le popolazioni e le caratteristiche, ma non il modo in cui sono correlati.

  3. Inoltre, non tutte le caratteristiche devono essere correlate alla popolazione. Ad esempio, se le diverse popolazioni hanno distribuzioni significativamente diverse delle caratteristiche A e B, ma non di C e D, il test del chi-quadrato può comunque tornare significativo.

  4. Se volessi misurare se una specifica caratteristica è influenzata o meno dalla popolazione, allora posso eseguire un test per proporzioni uguali (ho visto questo chiamato un test z, o come prop.test()in R) proprio su quella caratteristica.

In altre parole, è appropriato utilizzare il prop.test()per determinare più accuratamente la natura di una relazione tra due insiemi di categorie quando il test chi-quadrato afferma che esiste una relazione significativa?


Risposte:


23

Risposta molto breve:

Il test chi-quadrato ( chisq.test()in R) confronta le frequenze osservate in ciascuna categoria di una tabella di contingenza con le frequenze attese (calcolate come il prodotto delle frequenze marginali). Viene utilizzato per determinare se le deviazioni tra i conteggi osservati e quelli attesi sono troppo grandi per essere attribuite al caso. La partenza dall'indipendenza è facilmente verificabile ispezionando i residui (provare ?mosaicploto ?assocplot, ma anche guardare il vcdpacchetto). Utilizzare fisher.test()per un test esatto (basandosi sulla distribuzione ipergeometrica).

prop.test()z

z=(f1f2)p^(1p^)(1n1+1n2)

p^=(p1+p2)/(n1+n2)(1,2)H0:p1=p2χ2

> tab <- matrix(c(100, 80, 20, 10), ncol = 2)
> chisq.test(tab)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476

> prop.test(tab)

    2-sample test for equality of proportions with continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.15834617  0.04723506 
sample estimates:
   prop 1    prop 2 
0.8333333 0.8888889 

Per l'analisi di dati discreti con R, consiglio vivamente il manuale R (e S-PLUS) di accompagnare l'analisi categorica dei dati di Agresti (2002) , di Laura Thompson.


2
Esiste un nome comune per il test che prop.test () esegue?
Atticus29,

2
"Viene chiamato z-test".
Russellpierce,

@chl Sono un po 'confuso - ho pensato prop.tested chisq.testentrambi usano il chi-quadrato, che spiegherebbe gli stessi valori di p, e anche perché in questo post su R-Blogger hanno la loro funzione ad hoc.
Antoni Parellada,

@Antoni Sì, questo è ciò che Keith ha spiegato nella sua risposta.
chl

3
n1n2f1f2p1p2

23

zp

α

α

Il test più potente per l'uguaglianza delle proporzioni è chiamato test di Barnard per la superiorità .


@gung Sono un po 'confuso - ho pensato prop.tested chisq.testentrambi usano il chi-quadrato, che spiegherebbe gli stessi valori p, e anche perché in questo post su R-Blogger hanno la loro funzione ad hoc.
Antoni Parellada,

Non capisco cosa ti confonda, @AntoniParellada. Questa risposta afferma che sono "esattamente gli stessi", il che ha senso se "entrambi usano il chi-quadrato".
gung - Ripristina Monica

@gung nella risposta originale chl afferma che prop.test()... è indicato come un test z in contraddizione con chisq.test(). Più tardi Keith dice: "Un test chi-quadrato per l'uguaglianza di due proporzioni è esattamente la stessa cosa di un test z. (Ecco perché @chl ottiene lo stesso valore p con entrambi i test.)"
Antoni Parellada

1
Questo sembra essere solo un frase infelice, @AntoniParellada. Concettualmente, i 2 test sono distinti, ed è quello che ho discusso nell'altra mia risposta che hai visto. Ma matematicamente sono equivalenti. In effetti, credo che la funzione R in prop.test()realtà chiama chisq.test()e stampa l'output in modo diverso.
gung - Ripristina Monica

@gung Avevo lavorato su una funzione simile a R-Blogger e stavo per pubblicare un post per le persone a livello di principiante, citandoti infatti su alcuni concetti chiave che hai scritto, correndo attraverso la matematica sia per chi square e z-test, e quindi dando il codice R.
Antoni Parellada,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.