La mia domanda principale è come interpretare l'output (coefficienti, F, P) quando si esegue un ANOVA di tipo I (sequenziale)?
Il mio problema di ricerca specifico è un po 'più complesso, quindi spezzerò il mio esempio in parti. Innanzitutto, se sono interessato all'effetto della densità del ragno (X1) sulla crescita delle piante (Y1) e ho piantato piantine in recinti e densità del ragno manipolata, allora posso analizzare i dati con un semplice ANOVA o regressione lineare. Quindi non importa se ho usato la somma dei quadrati di tipo I, II o III (SS) per il mio ANOVA. Nel mio caso, ho 4 replicati di 5 livelli di densità, quindi posso usare la densità come fattore o come variabile continua. In questo caso, preferisco interpretarlo come una variabile indipendente (predittore) continua. Nel RI potrebbe essere eseguito il seguente:
lm1 <- lm(y1 ~ density, data = Ena)
summary(lm1)
anova(lm1)
L'esecuzione della funzione anova avrà senso per un confronto più avanti, si spera, quindi per favore ignora la stranezza qui. L'output è:
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4279 0.08058 .
Residuals 18 2.53920 0.14107
Ora, supponiamo che sospetti che il livello iniziale di azoto inorganico nel suolo, che non sono riuscito a controllare, possa aver influito in modo significativo sulla crescita delle piante. Non sono particolarmente interessato a questo effetto, ma vorrei potenzialmente spiegare la variazione che provoca. In realtà, il mio interesse principale è per gli effetti della densità del ragno (ipotesi: l'aumento della densità del ragno provoca un aumento della crescita delle piante - presumibilmente attraverso la riduzione degli insetti erbivori ma sto solo testando l'effetto e non il meccanismo). Potrei aggiungere l'effetto della N inorganica alla mia analisi.
Per il bene della mia domanda, facciamo finta di testare la densità di interazione * inorganica e non è significativa, quindi la rimuovo dall'analisi ed eseguo i seguenti effetti principali:
> lm2 <- lm(y1 ~ density + inorganicN, data = Ena)
> anova(lm2)
Analysis of Variance Table
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4113 0.08223 .
inorganicN 1 0.12936 0.12936 0.9126 0.35282
Residuals 17 2.40983 0.14175
Ora, fa la differenza se uso Tipo I o Tipo II SS (so che alcune persone si oppongono ai termini Tipo I e II ecc., Ma data la popolarità di SAS è facile da usare). R anova {stats} utilizza il Tipo I per impostazione predefinita. Posso calcolare il tipo II SS, F e P per densità invertendo l'ordine dei miei effetti principali oppure posso usare il pacchetto "auto" del Dr. John Fox (compagno della regressione applicata). Preferisco quest'ultimo metodo poiché è più facile per problemi più complessi.
library(car)
Anova(lm2)
Sum Sq Df F value Pr(>F)
density 0.58425 1 4.1216 0.05829 .
inorganicN 0.12936 1 0.9126 0.35282
Residuals 2.40983 17
La mia comprensione è che le ipotesi di tipo II sarebbero: "Non esiste alcun effetto lineare di x1 su y1 dato l'effetto di (mantenendo costante?) X2" e lo stesso per x2 dato x1. Immagino che sia qui che mi confondo. Qual è l'ipotesi testata dall'ANOVA usando il metodo di tipo I (sequenziale) sopra rispetto all'ipotesi usando il metodo di tipo II?
In realtà, i miei dati sono un po 'più complessi perché ho misurato numerose metriche di crescita delle piante, nonché dinamica dei nutrienti e decomposizione dei rifiuti. La mia analisi effettiva è qualcosa del tipo:
Y <- cbind(y1 + y2 + y3 + y4 + y5)
# Type II
mlm1 <- lm(Y ~ density + nitrate + Npred, data = Ena)
Manova(mlm1)
Type II MANOVA Tests: Pillai test statistic
Df test stat approx F num Df den Df Pr(>F)
density 1 0.34397 1 5 12 0.34269
nitrate 1 0.99994 40337 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
# Type I
maov1 <- manova(Y ~ density + nitrate + Npred, data = Ena)
summary(maov1)
Df Pillai approx F num Df den Df Pr(>F)
density 1 0.99950 4762 5 12 < 2e-16 ***
nitrate 1 0.99995 46248 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
Residuals 16