Ho un set di dati di esempio con 31 valori. Ho eseguito un test t a due code usando R per verificare se la media vera è uguale a 10:
t.test(x=data, mu=10, conf.level=0.95)
Produzione:
t = 11.244, df = 30, p-value = 2.786e-12
alternative hypothesis: true mean is not equal to 10
95 percent confidence interval:
19.18980 23.26907
sample estimates:
mean of x
21.22944
Ora sto provando a fare la stessa cosa manualmente:
t.value = (mean(data) - 10) / (sd(data) / sqrt(length(data)))
p.value = dt(t.value, df=length(lengths-1))
Il valore t calcolato con questo metodo è uguale a quello emesso dalla funzione t-test R. Il valore p, tuttavia, risulta essere 3.025803e-12.
Qualche idea su cosa sto facendo di sbagliato?
Grazie!
MODIFICARE
Ecco il codice R completo, incluso il mio set di dati:
# Raw dataset -- 32 observations
data = c(21.75, 18.0875, 18.75, 23.5, 14.125, 16.75, 11.125, 11.125, 14.875, 15.5, 20.875,
17.125, 19.075, 25.125, 27.75, 29.825, 17.825, 28.375, 22.625, 28.75, 27, 12.825,
26, 32.825, 25.375, 24.825, 25.825, 15.625, 26.825, 24.625, 26.625, 19.625)
# Student t-Test
t.test(x=data, mu=10, conf.level=0.95)
# Manually calculate p-value
t.value = (mean(data) - 10) / (sd(data) / sqrt(length(data)))
p.value = dt(t.value, df=length(data) - 1)