Volevo capire meglio il test esatto del pescatore, quindi ho escogitato il seguente esempio di giocattolo, dove f e m corrispondono a maschio e femmina e n e y corrispondono a "consumo di soda" in questo modo:
> soda_gender
f m
n 0 5
y 5 0
Ovviamente, questa è una drastica semplificazione, ma non volevo che il contesto si mettesse in mezzo. Qui ho solo supposto che i maschi non bevessero soda e le femmine bevessero soda, e volevo vedere se le procedure statistiche giungessero alla stessa conclusione.
Quando eseguo il test esatto del pescatore in R, ottengo i seguenti risultati:
> fisher.test(soda_gender)
Fisher's Exact Test for Count Data
data: soda_gender
p-value = 0.007937
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.0000000 0.4353226
sample estimates:
odds ratio
0
Qui, poiché il valore di p è 0,007937, concluderemmo che il consumo di genere e soda è associato.
So che il test esatto del pescatore è correlato alla distribuzione ipergeomterica. Quindi volevo ottenere risultati simili usando quello. In altre parole, puoi visualizzare questi problemi come segue: ci sono 10 palline, dove 5 sono etichettate come "maschio" e 5 sono etichettate come "femmina", e disegni 5 palline a caso senza sostituzione, e vedi 0 palline maschili . Qual è la possibilità di questa osservazione? Per rispondere a questa domanda, ho usato il seguente comando:
> phyper(q=0,m=5,n=5,k=5,lower.tail=TRUE)
[1] 0.003968254
Le mie domande sono: 1) Come mai i due risultati sono diversi? 2) C'è qualcosa di sbagliato o non rigoroso nel mio ragionamento sopra?