Quali sono alcune alternative al test chi-quadrato per variabili categoriali con tabelle più grandi di 2 x 2 e celle con un numero inferiore a 5, se non voglio unire le classi?
Quali sono alcune alternative al test chi-quadrato per variabili categoriali con tabelle più grandi di 2 x 2 e celle con un numero inferiore a 5, se non voglio unire le classi?
Risposte:
Ci sono alcuni malintesi comuni qui. Il test chi-quadrato è perfetto per l'uso con tabelle più grandi di . Affinché l'effettiva distribuzione della statistica del test del chi-quadrato si avvicini alla distribuzione del chi-quadrato, la tradizionale raccomandazione è che tutte le celle hanno valori previsti . Qui bisogna notare due cose:
Non importa quali siano i conteggi delle celle osservate - potrebbero essere senza alcun problema - contano solo i conteggi previsti .
Questa regola empirica tradizionale è ormai nota per essere troppo conservatrice. Può andare bene avere delle celle con conteggi previsti purché nessun conteggio atteso sia . Vedere:
Se i conteggi previsti non corrispondono a questo criterio più accurato, sono disponibili alcune opzioni alternative:
La soluzione migliore è probabilmente quella di simulare la distribuzione campionaria della statistica test o di utilizzare un test di permutazione. In R, ad esempio, puoi semplicemente impostare chisq.test(..., simulate.p.value=TRUE)
. Anche altri software dovrebbero renderlo possibile.
È possibile utilizzare un test alternativo, come il test esatto di Fisher. Sebbene l'esatto test di Fisher sia spesso raccomandato in questa situazione, vale la pena notare che fa ipotesi diverse e potrebbe non essere appropriato. Vale a dire, l'esatto test di Fisher presuppone che i conteggi di righe e colonne siano stati impostati in anticipo e che solo la disposizione delle combinazioni di riga x colonna possa variare (vedi: Data la potenza dei computer in questi giorni, c'è mai un motivo per fare un test chi-quadrato piuttosto che l'esatto test di Fisher? ). Se non ti senti a tuo agio con questa ipotesi, la simulazione del chi-quadrato sarà un'opzione migliore.