Come eseguire più test chi-quadrato post-hoc su un tavolo 2 X 3?


9

Il mio set di dati comprende la mortalità totale o la sopravvivenza di un organismo in tre tipi di siti: costiera, midchannel e offshore. I numeri nella tabella seguente rappresentano il numero di siti.

              100% Mortality            100% Survival
Inshore             30                       31 
Midchannel          10                       20 
Offshore             1                       10

Vorrei sapere se il numero di siti in cui si è verificata la mortalità al 100% è significativo in base al tipo di sito. Se corro un Chi-quadrato 2 x 3, ottengo un risultato significativo. Esiste un confronto a coppie post-hoc che posso eseguire o dovrei effettivamente utilizzare un ANOVA logistico o una regressione con distribuzione binomiale? Grazie!

Risposte:


7

Una tabella di contingenza dovrebbe contenere tutte le categorie reciprocamente esclusive su entrambi gli assi. Inshore / Midchannel / Offshore sembrano a posto, tuttavia a meno che "mortalità inferiore al 100%" non significhi "sopravvivenza al 100%" in questo contesto biologico, potrebbe essere necessario costruire tabelle che tengano conto di tutti i casi osservati o spiegare perché limitare la tua analisi all'estremo estremità del campione.

Poiché la sopravvivenza al 100% significa 0% di mortalità, potresti avere una tabella con colonne 100% = mortalità / 100%> mortalità> 0% / mortalità = 0%. In questo caso non dovrai più confrontare le percentuali, ma confrontare le misure di mortalità ordinale tra tre categorie di tipi di sito. (Che dire dell'utilizzo dei valori percentuali originali anziché delle categorie?) Una versione del test di Kruskal-Wallis può essere appropriata qui che prende in considerazione opportunamente i legami (forse un test di permutazione).

Esistono test post hoc stabiliti per il test Kruskal-Wallis: 1 , 2, 3 . (Un approccio di ricampionamento può aiutare ad affrontare i legami.)

La regressione logistica e la regressione binomiale possono essere ancora migliori in quanto non solo forniscono valori p, ma anche stime utili e intervalli di confidenza delle dimensioni dell'effetto. Tuttavia, per istituire tali modelli sarebbero necessari maggiori dettagli riguardanti i siti 100%> mortalità> 0%.


4

Presumo che "sopravvivenza al 100%" significhi che i tuoi siti contenessero solo un singolo organismo. così 30 significa che 30 organismi sono morti, e 31 significa che 31 organismi no. Sulla base di ciò, il chi-quadrato dovrebbe andare bene, ma dirà solo quali ipotesi non sono supportate dai dati - non ti dirà se due ipotesi ragionevoli sono migliori o meno. Vi presento un'analisi di probabilità che estrae queste informazioni: concorda con il test del chi-quadro, ma fornisce più informazioni rispetto al test del chi-quadrato e un modo migliore per presentare i risultati.

YijBin(1,θij)i2×3j

Ci sono due ipotesi globali alla base del test chi-quadro:

  1. θijθij=θik=θi
  2. YijθiYijθi

XiYijX1=30,X2=10,X3=1NiN1=61,N2=30,N3=11

HA:θ1=θ2,θ1=θ3,θ2=θ3

Ma quali sono le alternative? Direi le altre possibili combinazioni di uguale o non uguale.

HB1:θ1θ2,θ1θ3,θ2=θ3
HB2:θ1θ2,θ1=θ3,θ2θ3
HB3:θ1=θ2,θ1θ3,θ2θ3
HC:θ1θ2,θ1θ3,θ2θ3

HAI0

P(X1,X2,X3|N1,N2,N3,HA,I0)=01P(X1,X2,X3,θ|N1,N2,N3,HA,I0)dθ
=(N1X1)(N2X2)(N3X3)01θX1+X2+X3(1θ)N1+N2+N3X1X2X3dθ
=(N1X1)(N2X2)(N3X3)(N1+N2+N3+1)(N1+N2+N3X1+X2+X3)

Che è una distribuzione ipergeometrica divisa per una costante. Analogamente per avremo: HB1

P(X1,X2,X3|N1,N2,N3,HB1,I0)=01P(X1,X2,X3,θ1θ2|N1,N2,N3,HB1,I0)dθ1dθ2
=(N2X2)(N3X3)(N1+1)(N2+N3+1)(N2+N3X2+X3)

Puoi vedere lo schema per gli altri. Possiamo calcolare le probabilità per dire semplicemente dividendo le due espressioni precedenti. La risposta è circa , il che significa che i dati supportano su di circa un fattore - prove abbastanza deboli a favore di pari tassi. Le altre probabilità sono riportate di seguito.HAvsHB14HAHB14

Hypothesisprobability(HA|D)0.018982265(HB1|D)0.004790669(HB2|D)0.051620022(HB3|D)0.484155874(HC|D)0.440451171

Ciò sta dimostrando forti prove a parità di tassi, ma non in forti prove a favore di un'alternativa definitiva. Sembra che ci sia una forte evidenza che il tasso "offshore" è diverso dagli altri due tassi, ma prove inconcludenti sul fatto che i tassi "costieri" e "medio-canale" differiscano. Questo è ciò che il test del chi-quadrato non ti dirà - ti dice solo che l'ipotesi è "una schifezza" ma non quale alternativa mettere al suo postoA


1

Ecco il codice per eseguire i test del chi quadro e generare una varietà di statistiche dei test. Tuttavia, i test statistici di associazione dei margini della tabella sono inutili qui; la risposta è ovvia. Nessuno fa un test statistico per vedere se l'estate è più calda dell'inverno.

Chompy<-matrix(c(30,10,1,31,20,10), 3, 2)
Chompy
chisq.test(Chompy)
chisq.test(Chompy, simulate.p.value = TRUE, B = 10000)
chompy2<-data.frame(matrix(c(30,10,1,31,20,10,1,2,1,2,1,2,1,2,3,1,2,3), 6,3))
chompy2
chompy2$X2<-factor(chompy2$X2) 
chompy2$X3<-factor(chompy2$X3)
summary(fit1<-glm(X1~X2+X3, data=chompy2, family=poisson))
summary(fit2<-glm(X1~X2*X3, data=chompy2, family=poisson)) #oversaturated
summary(fit3<-glm(X1~1, data=chompy2, family=poisson)) #null
anova(fit3,fit1)
library(lmtest)
waldtest(fit1)
waldtest(fit2) #oversaturated
kruskal.test(X1~X2+X3, data=chompy2)
kruskal.test(X1~X2*X3, data=chompy2)

3
Sarebbe interessante per il lettore (e l'OP) se potessi fornire dettagli sulla diversa sintassi R (e sui test sottostanti) che hai dato, e in particolare su come un test di Kruskal-Wallis si confronta con un modello log-lineare.
chl

Puoi vederlo copiando e incollando il codice nella console R.
Patrick McCann,

1
Sicuro. Le risposte arrivano da sole eseguendo il codice, ovviamente.
chl

0

Credo che potresti usare gli "intervalli di confidenza simultanei" per fare confronti multipli. Il riferimento è Agresti et al. 2008 Intervalli di confidenza simultanei per il confronto dei parametri binomiali. Biometria 64 1270-1275.

È possibile trovare il codice R corrispondente in http://www.stat.ufl.edu/~aa/cda/software.html

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.