Il test di Barnard viene utilizzato quando il parametro di disturbo è sconosciuto sotto l'ipotesi nulla.
Tuttavia nel test di degustazione delle donne si potrebbe sostenere che il parametro di disturbo può essere impostato a 0,5 sotto l'ipotesi nulla (la donna non informata ha il 50% di probabilità di indovinare correttamente una tazza).
Quindi il numero di ipotesi corrette, sotto l'ipotesi nulla, diventa una distribuzione binomiale: indovinare 8 tazze con probabilità del 50% per ogni tazza.
In altre occasioni potresti non avere questa banale probabilità del 50% per l'ipotesi nulla. E senza margini fissi potresti non sapere quale dovrebbe essere quella probabilità. In tal caso è necessario il test di Barnard.
Anche se tu eseguissi il test di Barnard sul test del tè femminile, diventerebbe comunque del 50% (se il risultato è un'ipotesi corretta) poiché il parametro di disturbo con il valore p più alto è 0,5 e porterebbe al banale test binomiale ( in realtà è la combinazione di due test binomiali uno per le quattro prime tazze di latte e uno per le quattro prime tazze di tè).
> library(Barnard)
> barnard.test(4,0,0,4)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 0
Outcome II 0 4
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -2.82843
Nuisance parameter = 0.5 (One sided), 0.5 (Two sided)
P-value = 0.00390625 (One sided), 0.0078125 (Two sided)
> dbinom(8,8,0.5)
[1] 0.00390625
> dbinom(4,4,0.5)^2
[1] 0.00390625
Di seguito è riportato come andrebbe per un risultato più complicato (se non tutte le ipotesi sono corrette, ad esempio 2 contro 4), quindi il conteggio di ciò che è e ciò che non è estremo diventa un po 'più difficile
(Si noti inoltre che il test di Barnard utilizza, nel caso di un risultato di 4-2, un parametro di disturbo p = 0,686 che si potrebbe sostenere non corretto, il valore p per il 50% di probabilità di rispondere al "tè per primo" sarebbe 0,08203125. Questo diventa ancora più piccolo se si considera una regione diversa, invece quella basata sulla statistica di Wald, anche se definire la regione non è così facile )
out <- rep(0,1000)
for (k in 1:1000) {
p <- k/1000
ps <- matrix(rep(0,25),5) # probability for outcome i,j
ts <- matrix(rep(0,25),5) # distance of outcome i,j (using wald statistic)
for (i in 0:4) {
for (j in 0:4) {
ps[i+1,j+1] <- dbinom(i,4,p)*dbinom(j,4,p)
pt <- (i+j)/8
p1 <- i/4
p2 <- j/4
ts[i+1,j+1] <- (p2-p1)/sqrt(pt*(1-pt)*(0.25+0.25))
}
}
cases <- ts < ts[2+1,4+1]
cases[1,1] = TRUE
cases[5,5] = TRUE
ps
out[k] <- 1-sum(ps[cases])
}
> max(out)
[1] 0.08926748
> barnard.test(4,2,0,2)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 2
Outcome II 0 2
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -1.63299
Nuisance parameter = 0.686 (One sided), 0.314 (Two sided)
P-value = 0.0892675 (One sided), 0.178535 (Two sided)