La pagina Wikipedia su ANOVA elenca tre ipotesi , vale a dire:
- Indipendenza dei casi - questa è un'ipotesi del modello che semplifica l'analisi statistica.
- Normalità: le distribuzioni dei residui sono normali.
- Uguaglianza (o "omogeneità") delle varianze, chiamata omoscedasticità ...
Il punto di interesse qui è il secondo presupposto. Diverse fonti elencano l'assunzione in modo diverso. Alcuni sostengono la normalità dei dati grezzi, altri sostengono i residui.
Vengono visualizzate diverse domande:
- la normalità e la normale distribuzione dei residui sono la stessa persona (in base alla voce di Wikipedia, direi che la normalità è una proprietà e non riguarda direttamente i residui (ma può essere una proprietà dei residui (testo profondamente annidato tra parentesi, strano)))?
- in caso contrario, quale ipotesi dovrebbe valere? Uno? Entrambi?
- se l'assunzione di residui normalmente distribuiti è quella giusta, stiamo commettendo un grave errore controllando solo l'istogramma dei valori grezzi per la normalità?