Test esatto di Fisher e distribuzione ipergeometrica


12

Volevo capire meglio il test esatto del pescatore, quindi ho escogitato il seguente esempio di giocattolo, dove f e m corrispondono a maschio e femmina e n e y corrispondono a "consumo di soda" in questo modo:

> soda_gender

    f m
  n 0 5
  y 5 0

Ovviamente, questa è una drastica semplificazione, ma non volevo che il contesto si mettesse in mezzo. Qui ho solo supposto che i maschi non bevessero soda e le femmine bevessero soda, e volevo vedere se le procedure statistiche giungessero alla stessa conclusione.

Quando eseguo il test esatto del pescatore in R, ottengo i seguenti risultati:

> fisher.test(soda_gender)
Fisher's Exact Test for Count Data

data:  soda_gender
p-value = 0.007937
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
 0.0000000 0.4353226
sample estimates:
odds ratio 
         0 

Qui, poiché il valore di p è 0,007937, concluderemmo che il consumo di genere e soda è associato.

So che il test esatto del pescatore è correlato alla distribuzione ipergeomterica. Quindi volevo ottenere risultati simili usando quello. In altre parole, puoi visualizzare questi problemi come segue: ci sono 10 palline, dove 5 sono etichettate come "maschio" e 5 sono etichettate come "femmina", e disegni 5 palline a caso senza sostituzione, e vedi 0 palline maschili . Qual è la possibilità di questa osservazione? Per rispondere a questa domanda, ho usato il seguente comando:

> phyper(q=0,m=5,n=5,k=5,lower.tail=TRUE)
[1] 0.003968254

Le mie domande sono: 1) Come mai i due risultati sono diversi? 2) C'è qualcosa di sbagliato o non rigoroso nel mio ragionamento sopra?

Risposte:


10

L'esatto test di Fisher funziona condizionando i margini del tavolo (in questo caso, 5 maschi e femmine e 5 bevitori di bevande gassate e non bevitori). Secondo le ipotesi dell'ipotesi nulla, le probabilità cellulari di osservare un bevitore di bibite maschio, un bevitore maschio di non bibite, un bevitore di bibite femminile o un bevitore femminile di non bibite sono tutte ugualmente probabili (0,25) a causa dei totali del margine.

La tabella particolare che hai usato per la FET non ha altra tabella a parte il suo contrario, 5 bevitori di non-soda femminili e 5 bevitori di soda di sesso maschile, il che è "almeno altrettanto improbabile" sotto l'ipotesi nulla. Quindi noterai che raddoppiare la probabilità che hai ottenuto nella tua densità ipergeometrica ti dà il valore p FET.


Le note di Meng su phyper e fisher.test (che fanno la stessa cosa, ma hanno un'interfaccia molto diversa) sono molto utili: mengnote.blogspot.qa/2012/12/…
Aditya
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.