Qual è la statistica del test nel test esatto di Fisher?


9

Per una tabella 2 x 2 contingenza, alcuni detti test esatto di Fisher utilizza il conteggio in (1,1) cella della tabella come statistica test, e sotto ipotesi nulla, volontà avere una distribuzione ipergeometrica. X 1 , 1X1,1X1,1

Alcuni hanno affermato che la sua statistica di test è dove è la media della distribuzione ipergeometrica (menzionata sopra) sotto null. Ha anche detto che i valori di p sono determinati in base al tabel della distribuzione ipergometrica. Mi chiedevo se ci fosse qualche ragione per sottrarre la media e poi prendere il valore assoluto? non ha una distribuzione ipergeometrica sotto null, vero?μ | X 1 , 1 - μ |

|X1,1μ|
μ|X1,1μ|

Risposte:


10

(Per rendere le nostre nozioni un po 'più precise, chiamiamo la "statistica test" la distribuzione della cosa che guardiamo per calcolare effettivamente il valore p. Ciò significa che per un test t a due code, la nostra statistica test sarebbe |T| anziché T )

Che statistica test fa è indurre un ordinamento sullo spazio campione (o più propriamente, un ordinamento parziale), in modo da poter identificare i casi estremi (quelle più coerenti con l'alternativa).

Nel caso del test esatto di Fisher, c'è già un ordinamento in un certo senso - quali sono le probabilità delle stesse tabelle 2x2. Accade che corrispondano all'ordinamento su X1,1 nel senso che i valori più grandi o più piccoli di X1,1 sono "estremi" e sono anche quelli con la minima probabilità. Quindi, piuttosto che guardare i valori di X1,1 nel modo che suggerisci, puoi semplicemente lavorare dalle estremità grandi e piccole, ad ogni passo semplicemente aggiungendo qualsiasi valore (il più grande o più piccolo X1,1-valore non già presente) ha la minima probabilità associata ad esso, continuando fino a raggiungere la tabella osservata; sulla sua inclusione, la probabilità totale di tutte quelle tabelle estreme è il valore p.

Ecco un esempio:

funzione di probabilità ipergeometrica

> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
   x         prob rank
1  0 1.871194e-04    2
2  1 5.613581e-03    4
3  2 5.052223e-02    6
4  3 1.886163e-01    8
5  4 3.300786e-01   10
6  5 2.829245e-01    9
7  6 1.178852e-01    7
8  7 2.245433e-02    5
9  8 1.684074e-03    3
10 9 3.402171e-05    1

La prima colonna è X1,1 valori, la seconda colonna è la probabilità e la terza colonna è l'ordinamento indotto.

Quindi, nel caso particolare del test esatto di Fisher, la probabilità di ciascuna tabella (equivalentemente, di ciascun valore X1,1 ) può essere considerata la statistica del test effettivo .

|X1,1μ|X1,1

X1,1

[Modifica: alcuni programmi presentano una statistica test per il test Fisher; Suppongo che questo sarebbe un calcolo di tipo -2logL che sarebbe asintoticamente comparabile con un chi-quadrato. Alcuni possono anche presentare il rapporto di probabilità o il suo registro, ma questo non è del tutto equivalente.]


X1,1μ|X1,1μ|

Sembra una statistica di test estremamente ragionevole, dal momento che è completamente interpretabile e facilmente comprensibile. In effetti nessuna delle statistiche possibili avrà una distribuzione simmetrica. Dimentichiamo per un momento le specifiche del test Fisher: se quella statistica è significativa per te, puoi calcolare un test esatto su quella base (usando i calcoli ipergeometrici per trovare le probabilità). Se vuoi dimostrare che stanno inducendo lo stesso ordine in tutti i casi, questa è probabilmente una nuova domanda.
Glen_b

6

|X1,1μ|μ|X1,1μ|X1,1

X1,1kWBX1,1BWk


4

Non ne ha davvero uno. Le statistiche dei test sono un'anomalia storica - l'unica ragione per cui abbiamo una statistica test è arrivare a un valore p. L'esatto test di Fisher passa oltre una statistica di test e passa direttamente a un valore p.


Grazie, ma non esiste davvero una statistica di prova? Come si determina il valore p allora?
Tim

Il risultato del test esatto di Fisher è il valore p.
Jeremy Miles,

@JeremyMiles: vuoi dire che le statistiche dei test sono anomalie storiche in quanto prima dell'elaborazione a basso costo, gli utenti calcolavano Z, t e così via e quindi confrontavano questa statistica di test con le tabelle precalcolate per determinare la significatività statistica e, di conseguenza, molti utenti attuali di statistiche inferenziali pensano ancora in termini di statistiche di test quando potrebbero fornire altrettanto facilmente un valore p? In altre parole, è una sorta di effetto generazionale?
rabidotter,

1
@rabidotter - sì, credo di si. Vedi le persone che scrivono "F = 14.352, df = 2, 568, p <0,05". Praticamente l'unica ragione per cui a qualcuno importa di F è calcolare P, eppure danno a F una precisione enorme e una precisione molto ridotta.
Jeremy Miles
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.