Potere della signora che assaggia l'esperimento del tè


9

Nel famoso esperimento di Fisher osservabile è il numero di corretto tazza intuito avente due tipi di coppa A e B . Di solito è interessante calcolare la regione critica per rifiutare l'ipotesi nulla (la signora sta indovinando in modo casuale) date le dimensioni del test α . Questo può essere fatto facilmente usando la distribuzione ipergeometrica. Allo stesso modo posso calcolare la dimensione del test data la regione critica.kABα

Una domanda diversa è: come calcolare la potenza del test, data un'ipotesi alternativa? Supponiamo ad esempio che la signora sia in grado di indovinare correttamente con probabilità sulla singola tazza ( P ( indovina A | vero A ) = P ( indovina  B | vero  B ) = 0.9 ). Qual è la potenza del test, assumendo un numero totale di tazze pari a N = 8 e un numero totale di tazze di un tipo n = N / 2 = 4p=90%P(guessA|trueA)=P(guess B|true B)=0.9N=8n=N/2=4? (Purtroppo) la signora lo sa .n

Detto in altre parole: qual è la distribuzione di (numero di tazze corrette secondo l'ipotesi alternativa) se la signora sa che ci sono n tazze di un tipo?k=n


Pensando al tuo post ... Se Fisher decidesse di rifiutare il nulla solo se la signora avesse ragione su tutte le sue supposizioni (penso che fosse il caso), e c'è solo un modo possibile per ottenere tutte le tazze giuste, non dovrebbe la probabilità che ciò avvenga è essere la potenza effettiva? 0.94=0.6561
Antoni Parellada,

Non rifiuti quando indovina tutte le coppe in generale. Ma è vero che con questa è la regione critica. Non stai tenendo conto del fatto che la signora sa che ci sono 4 tazze di ogni tipo. A proposito, sono interessato alla soluzione generale N 8N=8N8
Ruggero Turra,

1
Questo è un problema interessante, ma difficile. È facile determinare le tabelle che porterebbero a rifiutare Ho, ma dovrebbero pensare alla probabilità di vedere quelle tabelle sotto Ha. Il seguente articolo calcola la potenza di una tabella leggermente modificata con una data sensibilità e specificità: "Una generalizzazione della procedura del tè-degustazione della signora per collegare gli approcci qualitativi e quantitativi nella ricerca psichiatrica" ​​di Falissard et al. Non sono sicuro che i calcoli siano corretti. Se hai davvero un problema binomiale, puoi usare il pacchetto Exact R, ma questo è un problema diverso che ti viene chiesto
Peter Calhoun,

Risposte:


3

In alternativa, la signora non indovina a caso, ma "non indovinare a caso" copre un'infinità di situazioni diverse. Potrebbe sempre indovinare perfettamente o potrebbe fare solo leggermente meglio delle ipotesi casuali ... e nel caso generale non c'è nemmeno una "scala" a variabile singola non casuale su cui lavorare (quindi non abbiamo nemmeno un potere curva a meno che non limitiamo il tipo di risposte non casuali che potrebbe dare).

Quindi, per calcolare un potere, dobbiamo essere molto specifici su come sia non casuale (e quanto non sia casuale in quel particolare modo).

Potremmo supporre, ad esempio, che abbia la sensazione di quanto ogni tazza abbia il sapore del latte aggiunto per primo - un indice di "primogenitura del latte" che è una variabile casuale su che ha un diverso ( superiore) significa quando il latte viene aggiunto per primo - ad esempio, possiamo supporre che sia normale o logistico, con media μ 0 e varianza σ 2 = 1 / ω 2 ( ω 2 è noto come "precisione") quando il latte viene aggiunto per ultimo e media μ 1 e varianza σ 2(,)μ0σ2=1/ω2ω2μ1σ2quando il latte viene aggiunto per primo (in effetti, una presunzione più semplice ma più restrittiva potrebbe essere quella di impostare, diciamo, modo che tutto sia ora una funzione di una variabile, la precisione). Quindi, per ogni dato valore di quei parametri, potremmo calcolare la probabilità che lei ottenga tutte e 8 le tazze corrette (che i quattro valori più piccoli di "primizie del latte" che sperimenta sono associati alle quattro tazze di latte seconde); se il calcolo esatto fosse troppo difficile per noi, potremmo simularlo con la precisione desiderata. [Nel caso in cui si presuma che la non casualità sia una funzione di una sola variabile, avremmo una curva di potenza - un valore per la potenza per ciascun valore del parametro.]μ1=μ0=1

Questo è un tipo specifico di modello per come potrebbe funzionare "meglio che a caso" con la quale potremmo specificare i parametri e ottenere un valore per la potenza.

Ovviamente potremmo supporre molte altre forme di non casualità oltre a questa.


3

La distribuzione del numero corretto di ipotesi in base all'ipotesi alternativa segue una distribuzione ipergeometrica non centrale , che è parametrizzata in termini di odds ratio, ovvero quanto più alte sono le probabilità che la signora indovinerà "prima il tè" quando infatti il ​​tè è stato davvero aggiunto prima rispetto a quando in realtà è stato aggiunto prima il latte (o viceversa). Se il rapporto di probabilità è 1, otteniamo la distribuzione ipergeometrica centrale.

Vediamo se funziona. Userò R a scopo illustrativo, usando il MCMCpackpacchetto, che ha la funzione dnoncenhypergeom()di calcolare la densità di una distribuzione ipergeometrica (non centrale). Ha argomenti xper il corretto numero di tentativi (attenzione: questo è il numero corretto di tentativi in una delle due condizioni, ad esempio, quando il tè è stato davvero aggiunto prima), argomenti n1, n2e m1per tre dei quattro margini, e psiper il vero rapporto di probabilità. Calcoliamo la densità per xuguale a 0 a 4 (con tutti i margini uguali a 4) quando il rapporto di probabilità reale è 1:

install.packages("MCMCpack")
library(MCMCpack)
sapply(0:4, function(x) dnoncenhypergeom(x, n1=4, n2=4, m1=4, psi=1))

Questo produce:

[1] 0.01428571 0.22857143 0.51428571 0.22857143 0.01428571

Quindi, c'è una probabilità dell'1,43% che la signora faccia 8 ipotesi corrette (cioè, indovina correttamente tutte e 4 le tazze dove è stato aggiunto il tè per primo e quindi indovina anche tutte e 4 le tazze correttamente dove è stato aggiunto il latte per primo) sotto l'ipotesi nulla. Questa è in effetti la quantità di prove che Fisher ha ritenuto sufficienti per respingere l'ipotesi nulla.

(.90/(1.90))/(.10/(1.10))=81odds(guessA|trueA)/odds(guessA|trueB)). Quali sono le possibilità ora che la signora indovinerà correttamente tutte e 8 le tazze (cioè, indovinerà tutte e 4 le tazze correttamente dove è stato aggiunto prima il tè e quindi anche le 4 tazze correttamente dove è stato aggiunto prima il latte)?

dnoncenhypergeom(4, n1=4, n2=4, m1=4, psi=81)

Questo produce:

[1] 0.8312221

Quindi la potenza è all'83% circa.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.