Quale distribuzione assume il test esatto di Fisher?


11

Nel mio lavoro ho visto diversi usi del test esatto di Fisher e mi chiedevo quanto si adattava ai miei dati. Osservando diverse fonti ho capito come calcolare la statistica, ma non ho mai visto una spiegazione chiara e formale dell'ipotesi nulla assunta.

Qualcuno può spiegarmi o riferirmi a una spiegazione formale della distribuzione ipotizzata? Sarà grato per una spiegazione in termini di valori nella tabella di contingenza.


3
Nel caso 2x2 si basa sulla distribuzione ipergeometrica.
Glen_b

Risposte:


11

Nel caso l'assunzione distributiva è data da due variabili casuali binomiali indipendenti e . L'ipotesi nulla è l'uguaglianza . Ma il test esatto di Fisher è un test condizionale: si basa sulla distribuzione condizionale di dato . Questa distribuzione è una distribuzione ipergeometrica con un parametro sconosciuto: il rapporto di probabilità e quindi l'ipotesi nulla è .X 1B i n ( n 1 , θ 1 ) X 2B i n ( n 2 , θ 2 ) θ 1 = θ 2 X 1 X 1 + X 2 ψ = θ 12×2X1~Bion(n1,θ1)X2~Bion(n2,θ2)θ1=θ2X1X1+X2 ψ=1ψ=θ11-θ1θ21-θ2ψ=1

Questa distribuzione ha la sua pagina Wikipedia .

Per valutarlo con R, puoi semplicemente usare la formula che definisce la probabilità condizionale:

p1 <- 7/27
p2 <- 14/70
x1 <- 7; n1 <- 27
x2 <- 14; n2 <- 56
# 
m <- x1+x2
dbinom(x1, n1, p1)*dbinom(x2, n2, p2)/sum(dbinom(0:m, n1, p1)*dbinom(m-(0:m), n2, p2))
[1] 0.1818838

Oppure usa la dnoncenhypergeomfunzione del MCMCpackpacchetto:

psi <- p1/(1-p1)/(p2/(1-p2)) # this is the odds ratio
MCMCpack::dnoncenhypergeom(x=x1, n1, n2, x1+x2, psi)
[1] 0.1818838

Grazie @ Stefano. Puoi spiegare ulteriormente perché diventa ipergeometrico e quali sono i parametri?
Amit Lavon,

2
Scusa @AmitLavon, non conosco i dettagli di questa distribuzione ipergeometrica.
Stéphane Laurent,

1
@AmitLavon Ho appena modificato la mia risposta per includere il link a Wikipedia e il codice R.
Stéphane Laurent,

10

Il cosiddetto test "esatto" di Fisher fa lo stesso tipo di ipotesi sottili che fanno i test .χ2

  • Le due variabili in fase di valutazione per associazione sono variabili polittomicamente tutto-o-niente come gli USA / Europa morti / vivi. Se una o entrambe le variabili sono una semplificazione di un continuum sottostante, l'analisi dei dati categorici non dovrebbe essere intrapresa affatto.
  • Non ci sono altre variabili di sfondo rilevanti. Se è la variabile di risultato e è una variabile valutata per l'associazione con , la probabilità che sia identica per ogni soggetto con fissata su . Tabelle di contingenza assumere in senso che non v'è eterogeneità nella distribuzione di che non è rappresentato da . Ad esempio, in uno studio clinico randomizzato che studia l'effetto del trattamento A vs. B sulla probabilità di morte, aYXYY=yXXYX2×2il test della tabella di contengency presuppone che ogni soggetto in trattamento A abbia la stessa probabilità di morte. [Si potrebbe sostenere che questo è un presupposto troppo rigoroso, ma quella posizione non riconosce la perdita di potere derivante da prove di associazione non corrette.]

Il test di Fisher fa un'ipotesi non fatta da test incondizionati di associazione come il test Pearson : che siamo interessati alla distribuzione marginale "attuale" di e , cioè stiamo condizionando le frequenze di categorie di risultati. Questo non è ragionevole per studi prospettici. L'uso del test di Fisher porta al conservatorismo. I suoi valori sono in media troppo grandi, perché il test garantisce che i valori non siano troppo piccoli. In media, i valori di Pearson sono più precisi di quelli di Fisher, anche con frequenze attese molto inferiori a 5 in alcune delle celle.χ2XYYPPχ2 P


Grazie @FrankHarrell. Puoi fornire riferimenti per la tua affermazione sui valori di chi-quadro P più precisi di quelli di Fisher?
Amit Lavon,

1
Vedi ad esempio citeulike.org/user/harrelfe/tag/fishers-exact-test . Questo è stato discusso a lungo su stackexchange.
Frank Harrell,

purtroppo ctiteulike è sparito e web.archive.org sembra aver strisciato solo la prima pagina dell'account harrelfe.
Glen_b

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.