Fisher Test in R


11

Supponiamo di avere il seguente set di dati:

                Men    Women    
Dieting         10      30
Non-dieting     5       60

Se eseguo il test esatto di Fisher in R, che cosa implica alternative = greater(o meno)? Per esempio:

mat = matrix(c(10,5,30,60), 2,2)
fisher.test(mat, alternative="greater")

Ottengo il p-value = 0.01588e odds ratio = 3.943534. Inoltre, quando capovolgo le righe della tabella di contingenza in questo modo:

mat = matrix(c(5,10,60,30), 2, 2)
fisher.test(mat, alternative="greater")

poi ottengo il p-value = 0.9967e odds ratio = 0.2535796. Ma quando eseguo le due tabelle di contingenza senza l'argomento alternativo (cioè, fisher.test(mat)) ottengo il p-value = 0.02063.

  1. Potresti spiegarmi il motivo per favore?
  2. Inoltre, qual è l'ipotesi nulla e l'ipotesi alternativa nei casi precedenti?
  3. Posso eseguire il test Fisher su una tabella di contingenza come questa:

    mat = matrix(c(5000,10000,69999,39999), 2, 2)

PS: non sono uno statistico. Sto cercando di imparare le statistiche in modo che il tuo aiuto (risposte in inglese semplice) sia molto apprezzato.

Risposte:


11

greater(o less) si riferisce a un test unilaterale che confronta un'ipotesi nulla p1=p2rispetto all'alternativa p1>p2(o p1<p2). Al contrario, un test su due lati confronta le ipotesi nulle con l'alternativa che p1non è uguale a p2.

Per la tua tabella, la proporzione di persone a dieta di sesso maschile è 1/4 = 0,25 (10 su 40) nel tuo campione. D'altra parte, la percentuale di persone che non sono a dieta di sesso maschile è 1/13 o (5 su 65) pari a 0,077 nel campione. Quindi la stima per p1è 0,25 e per p20,077. Pertanto sembra che p1>p2.

Ecco perché per l'alternativa unilaterale p1>p2il valore p è 0,01588. (Piccoli valori p indicano che l'ipotesi nulla è improbabile e che l'alternativa è probabile.)

Quando l'alternativa è p1<p2, vediamo che i tuoi dati indicano che la differenza è nella direzione sbagliata (o imprevista).

Ecco perché in quel caso il valore p è così alto 0,9997. Per l'alternativa a due lati, il valore p dovrebbe essere leggermente superiore a quello per l'alternativa a un lato p1>p2. E infatti, ha un valore p pari a 0,02063.


1
Spiegazione fantastica. Quindi, il test esatto del pescatore confronta effettivamente le probabilità tra le file rispetto alle colonne?
Christian,

@Christian: No, non importa se le sue righe o colonne come test di Fisher controllano la correlazione in una tabella di contingenza. Le righe e le colonne non contano direttamente. Potresti anche semplicemente riformulare l'ipotesi: invece H0 essendo "le persone che fumano muoiono più giovani" potresti anche assumere H0: "le persone che muoiono più giovani hanno maggiori probabilità di fumare". I risultati del test di Fisher ti direbbero se qualsiasi connessione osservata nei dati supporta o meno l'ipotesi nulla, ma non importa quale sia la variabile indipendente o dipendente e allo stesso modo la scelta delle righe / colonne non importa: )
Dominique Paul,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.