Test multipli Chi-quadrato


11

Ho dati incrociati in una tabella 2 x 2 x 6. Chiamiamo le dimensioni response, Ae B. Adatto una regressione logistica ai dati con il modello response ~ A * B. Un'analisi della devianza di quel modello afferma che sia i termini che la loro interazione sono significativi.

Tuttavia, osservando le proporzioni dei dati, sembra che solo 2 livelli Bsiano responsabili di questi effetti significativi. Vorrei testare per vedere quali livelli sono i colpevoli. In questo momento, il mio approccio è quello di eseguire 6 test chi-quadrato su 2 x 2 tabelle di response ~ A, e quindi di regolare i valori p di quei test per confronti multipli (usando la regolazione di Holm).

La mia domanda è se esiste un approccio migliore a questo problema. Esiste un approccio di modellazione più basato sui principi o un approccio di confronto di più test chi-quadrato?


Una volta ho posto la stessa domanda sulla mailing list di R e non ho ricevuto risposta. Ti suggerirei di cambiare il titolo poiché la tua domanda riguarda "l'analisi post hoc del chi-quadrato - per rilevare la causa del significato" (titoli più brevi di quelli che ho proposto sarebbero migliori :))
Tal Galili

Guarda le beta per i tuoi colpevoli .... E usa un modello logaritmico a poisson. Quindi ottieni la stessa cosa di quello che ti dà il test chi-quadro, ma ottieni tutti i diversi test contemporaneamente.
Probislogic

Risposte:


11

Dovresti esaminare il "partizionamento chi-quadrato". Ciò è simile nella logica all'esecuzione di test post-hoc in ANOVA. Ti permetterà di determinare se il tuo test complessivo significativo è principalmente attribuibile a differenze in determinate categorie o gruppi di categorie.

Un rapido google ha rivelato questa presentazione, che alla fine discute i metodi per il partizionamento del chi-quadrato.

http://www.ed.uiuc.edu/courses/EdPsy490AT/lectures/2way_chi-ha-online.pdf


Interessante. Ti sei mai imbattuto in un'implementazione R di questo?
Tal Galili,

No, non direttamente. Tuttavia, R ti fornirà tutto ciò di cui hai bisogno per fare questo, come ad esempio: i conteggi osservati, i valori previsti e i residui per ogni cella. x <- matrice (c (12, 5, 7, 7), ncol = 2) chisq.test (x) osservato chisq.test (x) $ residuiexpectedchisq.test(x)
Brett

Ti darò il segno di spunta, poiché questo dovrebbe essere utile per la mia vita di ricerca. Tuttavia, questo approccio è applicabile a una matrice ixj. Tuttavia, la mia domanda riguarda una matrice ixjxk,
JoFrhwld

2
Il partizionamento Chi-quadrato è estensibile alle tabelle di contingenza a più vie. Ecco l'articolo che Agresti cita nel suo libro, in effetti ... HO Lancaster (1951) "Tabelle di contingenza complesse trattate dalla divisione di χ2" Journal of the Royal Statistical Society. Serie B (metodologica), vol. 13, n. 2
Brett

1

L'approccio senza principi è quello di scartare i dati sproporzionati, rimontare il modello e vedere se i rapporti di probabilità logit / condizionali per la risposta e A sono molto diversi (controllando per B). Questo potrebbe dirti se c'è motivo di preoccupazione. Unire i livelli di B è un altro approccio. Su più linee di principio, se sei preoccupato per le proporzioni relative che inducono il paradosso di Simpson, puoi esaminare i rapporti di probabilità condizionali e marginali per la risposta / A e vedere se si invertono.

Per evitare confronti multipli in particolare, l'unica cosa che mi viene in mente è usare un modello gerarchico che tiene conto degli effetti casuali tra i livelli.


0

Non so esattamente quali siano i tuoi obiettivi o perché siano quelli che sono. Ma piuttosto che test di ipotesi, di solito consiglio di focalizzare l'attenzione su previsioni e intervalli di confidenza.


0

Il test Post Hoc potrebbe adattarsi al tuo problema. funzione chisqPostHoc () nei test R per differenze significative tra tutte le coppie di popolazioni in un test chi-quadro. Anche se non l'ho usato, ma questo link potrebbe essere utile. https://www.rforge.net/doc/packages/NCStats/chisqPostHoc.html

Un'altra alternativa potrebbe essere la funzione chisq.desc () dal pacchetto EnQuireR.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.