Supponiamo la seguente situazione:
abbiamo un numero elevato (ad es. 20) con gruppi di piccole dimensioni (ad es. n = 3). Ho notato che se generi valori dalla distribuzione uniforme, i residui appariranno approssimativamente normali anche se la distribuzione dell'errore è uniforme. Il seguente codice R dimostra questo comportamento:
n.group = 200
n.per.group = 3
x <- runif(n.group * n.per.group)
gr <- as.factor(rep(1:n.group, each = n.per.group))
means <- tapply(x, gr, mean)
x.res <- x - means[gr]
hist(x.res)
Se guardo il residuo di un campione in un gruppo di tre, il motivo del comportamento è chiaro:
Poiché è una somma di variabili casuali con una deviazione standard non approssimativamente diversa, la sua distribuzione è un po 'più vicina alla distribuzione normale rispetto ai singoli termini.
Ora supponiamo che io abbia la stessa situazione con dati reali invece di dati simulati. Voglio valutare se valgono le ipotesi ANOVA relative alla normalità. Le procedure più raccomandate raccomandano l'ispezione visiva dei residui (ad es. Diagramma QQ) o un test di normalità sui residui. Come il mio esempio sopra, questo non è davvero ottimale per gruppi di piccole dimensioni.
Esiste un'alternativa migliore quando ho molti gruppi di piccole dimensioni?