Se stai eseguendo ANOVA a una via per verificare se esiste una differenza significativa tra i gruppi, implicitamente stai confrontando due modelli nidificati (quindi esiste solo un livello di annidamento, ma è ancora annidato).
Questi due modelli sono:
- yio jiojβ^0
yio j= β^0+ ϵio
Modello 1: i valori sono modellati dalla media stimata dei gruppi.
βj^
yio= β^0+ β^j+ ϵio
Un esempio di confronto tra mezzi ed equivalenza ai modelli nidificati: prendiamo la lunghezza sepal (cm) dal set di dati dell'iride (se usiamo tutte e quattro le variabili potremmo effettivamente fare LDA o MANOVA come Fisher nel 1936)
I mezzi totali e di gruppo osservati sono:
μt o t a lμs e t o s aμv e r s i c o l o rμv i r gi n i c a= 5,83= 5,01= 5.94= 6.59
Che è in forma di modello:
modello 1: modello 2: yio j= 5,83 + ϵioyio j= 5,01 + ⎡⎣⎢00.931.58⎤⎦⎥j+ ϵio
∑ ϵ2io= 102.1683
∑ ϵ2io= 38.9562
E la tabella ANOVA sarà simile (e calcolerà implicitamente la differenza che è la somma dei quadrati tra i gruppi che è il 63.212 nella tabella con 2 gradi di libertà):
> model1 <- lm(Sepal.Length ~ 1 + Species, data=iris)
> model0 <- lm(Sepal.Length ~ 1, data=iris)
> anova(model0, model1)
Analysis of Variance Table
Model 1: Sepal.Length ~ 1
Model 2: Sepal.Length ~ 1 + Species
Res.Df RSS Df Sum of Sq F Pr(>F)
1 149 102.168
2 147 38.956 2 63.212 119.26 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
F= R SSdio ffe r e n c eD Fdio ffe r e n c eR SSn e wD Fn e w= 63.212238,956147= 119,26
set di dati utilizzato nell'esempio:
lunghezza del petalo (cm) per tre diverse specie di fiori di iris
Iris setosa Iris versicolor Iris virginica
5.1 7.0 6.3
4.9 6.4 5.8
4.7 6.9 7.1
4.6 5.5 6.3
5.0 6.5 6.5
5.4 5.7 7.6
4.6 6.3 4.9
5.0 4.9 7.3
4.4 6.6 6.7
4.9 5.2 7.2
5.4 5.0 6.5
4.8 5.9 6.4
4.8 6.0 6.8
4.3 6.1 5.7
5.8 5.6 5.8
5.7 6.7 6.4
5.4 5.6 6.5
5.1 5.8 7.7
5.7 6.2 7.7
5.1 5.6 6.0
5.4 5.9 6.9
5.1 6.1 5.6
4.6 6.3 7.7
5.1 6.1 6.3
4.8 6.4 6.7
5.0 6.6 7.2
5.0 6.8 6.2
5.2 6.7 6.1
5.2 6.0 6.4
4.7 5.7 7.2
4.8 5.5 7.4
5.4 5.5 7.9
5.2 5.8 6.4
5.5 6.0 6.3
4.9 5.4 6.1
5.0 6.0 7.7
5.5 6.7 6.3
4.9 6.3 6.4
4.4 5.6 6.0
5.1 5.5 6.9
5.0 5.5 6.7
4.5 6.1 6.9
4.4 5.8 5.8
5.0 5.0 6.8
5.1 5.6 6.7
4.8 5.7 6.7
5.1 5.7 6.3
4.6 6.2 6.5
5.3 5.1 6.2
5.0 5.7 5.9
anova()
funzione, perché anche il primo, vero, ANOVA sta usando un F-test. Ciò porta alla confusione terminologica.