Correzione della continuità di Yates per 2 x 2 tabelle di contingenza


9

Vorrei raccogliere input da persone sul campo sulla correzione della continuità di Yates per 2 x 2 tabelle di contingenza. L'articolo di Wikipedia menziona che potrebbe adattarsi troppo lontano e viene quindi utilizzato solo in senso limitato. Il post correlato qui non offre ulteriori approfondimenti.

Quindi, per le persone che usano questi test regolarmente, quali sono i tuoi pensieri? È meglio usare la correzione o no?

E un esempio del mondo reale che produrrebbe risultati diversi con un livello di confidenza del 95%. Nota che questo era un problema di compiti a casa, ma la nostra classe non si occupa affatto della correzione della continuità di Yates, quindi dormi tranquillo sapendo che non stai facendo i compiti per me.

samp <- matrix(c(13, 12, 15, 3), byrow = TRUE, ncol = 2)
colnames(samp) <- c("No", "Yes")
rownames(samp) <- c("Female", "Male")

chisq.test(samp, correct = TRUE)
chisq.test(samp, correct = FALSE)    

Risposte:


6

La correzione di Yates porta a test più conservativi rispetto ai test "esatti" di Fisher.

Ecco un tutorial online sull'uso della correzione della continuità di Yates , di Stefanescu et al, che evidenzia chiaramente vari difetti della correzione sistematica per la continuità (pagg. 4-6). Citando Agresti ( CDA 2002), "Yates (1934) menzionò che Fisher gli suggerì l'ipergeometria per un test esatto", il che portò alla versione corretta di continuità di . Agresti ha anche indicato che il test di Fisher è una buona alternativa ora che i computer possono farlo anche per campioni di grandi dimensioni (p. 103). Ora, il punto è che la scelta di un test dipende in realtà dalla domanda che viene posta e dalle ipotesi che vengono fatte da ciascuno di essi (ad esempio, nel caso del test di Fisher assumiamo che i margini siano fissi).χ2

Nel tuo caso, Fisher test e corretti concordano e producono un valore superiore al 5%. Nel caso del normale , se i valori sono calcolati usando un approccio Monte Carlo (vedi ), anche questo non riesce a raggiungere il significato. p χ 2 pχ2pχ2psimulate.p.value

Altri riferimenti utili che trattano di piccoli problemi relativi alle dimensioni del campione e all'uso eccessivo del test di Fisher includono:


Grazie per i riferimenti. Sono stato in grado di trovare una versione "prestampata" del documento Campbell qui per coloro che non possono accedere a Pub Med.
Insegui il

3

Se hai conteggi abbastanza bassi che la correzione Yates è una preoccupazione (come nel tuo esempio), probabilmente dovresti usare il test esatto di Fisher. Altrimenti, raccomando che dopo aver usato il test chi-quadro su una tabella 2x2, confermi il test con un test z del rapporto di probabilità di registro.


Perché verificare con un rapporto di probabilità del registro z -test? Questo è un test Wald, e i test Wald in genere hanno prestazioni peggiori rispetto ai punteggi, come il test chi-quadrato di Pearson. Questa è nota per essere un'eccezione?
onestop il

grazie per l'informazione! Il test di Fisher sembra essere un metodo più solido per domande come queste. Non credo che il corso che sto seguendo affronterà il test di Fisher, ma lo terrò sicuramente a mente per le applicazioni del mondo reale.
Insegui il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.