Ho dei dati per due gruppi (cioè campioni) che vorrei confrontare ma la dimensione totale del campione è piccola (n = 29) e fortemente sbilanciata (n = 22 vs n = 7).
Questi dati sono logisticamente difficili e costosi da raccogliere, quindi mentre "raccogliere più dati" come soluzione ovvia non è utile in questo caso.
Sono state misurate una serie di variabili diverse (data di partenza, data di arrivo, durata della migrazione, ecc.), Quindi esistono più test, alcuni dei quali le varianze sono molto diverse (il campione più piccolo ha una varianza più elevata).
Inizialmente un collega ha eseguito i test t su questi dati e alcuni erano statisticamente significativi con P <0,001, un altro non era significativo con P = 0,069. Alcuni campioni erano normalmente distribuiti, altri no. Alcuni test hanno comportato grandi deviazioni da varianze "uguali".
Ho diverse domande:
- i t-test sono appropriati qui? Se no, perché? Questo si applica solo ai test in cui sono soddisfatte le ipotesi di normalità e uguaglianza delle varianze?
- quali sono le alternative adatte? Forse un test di permutazione?
- varianza ineguale gonfia l'errore di tipo I, ma come? e quale effetto ha la dimensione ridotta e sbilanciata del campione sull'errore di tipo I?