Sto cercando di risolvere la seguente domanda:
Il giocatore A ha vinto 17 partite su 25 mentre il giocatore B ne ha vinte 8 su 20 - c'è una differenza significativa tra i due rapporti?
La cosa da fare in R che mi viene in mente è la seguente:
> prop.test(c(17,8),c(25,20),correct=FALSE)
2-sample test for equality of proportions without continuity correction
data: c(17, 8) out of c(25, 20)
X-squared = 3.528, df = 1, p-value = 0.06034
alternative hypothesis: two.sided
95 percent confidence interval:
-0.002016956 0.562016956
sample estimates:
prop 1 prop 2
0.68 0.40
Quindi questo test afferma che la differenza non è significativa al livello di confidenza del 95%.
Perché sappiamo che prop.test()
sta usando solo un'approssimazione, voglio rendere le cose più esatte usando un test binomiale esatto - e lo faccio in entrambi i modi:
> binom.test(x=17,n=25,p=8/20)
Exact binomial test
data: 17 and 25
number of successes = 17, number of trials = 25, p-value = 0.006693
alternative hypothesis: true probability of success is not equal to 0.4
95 percent confidence interval:
0.4649993 0.8505046
sample estimates:
probability of success
0.68
> binom.test(x=8,n=20,p=17/25)
Exact binomial test
data: 8 and 20
number of successes = 8, number of trials = 20, p-value = 0.01377
alternative hypothesis: true probability of success is not equal to 0.68
95 percent confidence interval:
0.1911901 0.6394574
sample estimates:
probability of success
0.4
Ora è strano, no? I valori p ogni volta sono totalmente diversi! In entrambi i casi ora i risultati sono (altamente) significativi ma i valori di p sembrano saltare piuttosto a casaccio.
Le mie domande
- Perché i p-value che diverso ogni volta?
- Come eseguire un test binomiale esatto in due proporzioni campione in R correttamente?
prop.test
vschisq.test
), lo stesso concetto di base è in questa domanda . Stai eseguendo tre diversi test con differenti "ipotesi nulla" in ciascuno dei tuoi tre esempi.