Sto guardando un foglio Excel che afferma di calcolare il , ma non riconosco questo modo di farlo, e mi chiedevo se mi mancasse qualcosa.
Ecco i dati che sta analizzando:
+------------------+----------+----------+
| Total Population | Observed | Expected |
+------------------+----------+----------+
| 2000 | 42 | 32.5 |
| 2000 | 42 | 32.5 |
| 2000 | 25 | 32.5 |
| 2000 | 21 | 32.5 |
+------------------+----------+----------+
E qui ci sono le somme che fa per ogni gruppo per calcolare il chi quadrato:
P = (sum of all observed)/(sum of total population) = 0.01625
A = (Observed - (Population * P)) ^2
B = Total Population * P * (1-P)
ChiSq = A/B
Quindi per ogni gruppo il è:
2.822793
2.822793
1.759359
4.136448
E il totale Piazza Chi è: 11.54139
.
Tuttavia, ogni esempio che ho visto di calcolare è completamente diverso da questo. Farei per ogni gruppo:
chiSq = (Observed-Expected)^2 / Expected
E quindi per l'esempio sopra otterrei un valore chi quadrato totale di 11.3538
.
La mia domanda è: perché nel foglio Excel stanno calcolando in questo modo? È un approccio riconosciuto?
AGGIORNARE
La mia ragione per voler sapere questo è che sto cercando di replicare questi risultati nel linguaggio R. Sto usando la funzione chisq.test e non esce con lo stesso numero del foglio Excel. Quindi, se qualcuno sa come fare questo approccio in R, sarebbe molto utile!
AGGIORNAMENTO 2
Se qualcuno è interessato, ecco come l'ho calcolato in R:
res <- matrix(c((2000-42), 42, (2000-42), 42, (2000-25), 25, (2000-21), 21), 2, 4)
chisq.test(res)
x=c(42,42,25,21);chisq.test(cbind(x,2000-x))