Il modello lineare generale ci consente di scrivere un modello ANOVA come modello di regressione. Supponiamo di avere due gruppi con due osservazioni ciascuno, cioè quattro osservazioni in un vettore . Quindi il modello originale, sovra-parametrizzato è , dove è la matrice dei predittori, ovvero variabili di indicatore con codice fittizio:
E ( y ) = X ⋆ β ⋆ X ⋆ ( μ 1 μ 1 μ 2 μ 2 ) = ( 1 1 0 1 1 0 1 0 1 1 0 1 ) ( β ⋆ 0 β ⋆ 1 β ⋆ 2 )yE(y)=X⋆β⋆X⋆
⎛⎝⎜⎜⎜μ1μ1μ2μ2⎞⎠⎟⎟⎟=⎛⎝⎜⎜⎜111111000011⎞⎠⎟⎟⎟⎛⎝⎜β⋆0β⋆1β⋆2⎞⎠⎟
I parametri non sono identificabili come perché ha rango 2 ( non è invertibile). Per cambiarlo, introduciamo il vincolo (contrasti del trattamento), che ci dà il nuovo modello :
((X⋆)′X⋆)−1(X⋆)′E(y)X⋆(X⋆)′X⋆β⋆1=0E(y)=Xβ
⎛⎝⎜⎜⎜μ1μ1μ2μ2⎞⎠⎟⎟⎟=⎛⎝⎜⎜⎜11110011⎞⎠⎟⎟⎟(β0β2)
Quindi , ovvero assume il significato del valore atteso dalla nostra categoria di riferimento (gruppo 1). , ovvero assume il significato della differenza nella categoria di riferimento. Poiché con due gruppi, esiste solo un parametro associato all'effetto gruppo, l'ipotesi nulla ANOVA (tutti i parametri effetto gruppo sono 0) è uguale all'ipotesi nulla peso di regressione (il parametro pendenza è 0).μ1=β0β0μ2=β0+β2β2μ2−μ1
Un test nel modello lineare generale verifica una combinazione lineare dei parametri rispetto a un valore ipotizzato sotto l'ipotesi nulla. Scegliendo , possiamo quindi verificare l'ipotesi che (il solito test per il parametro di pendenza), cioè qui, . Lo stimatore è , dove sono i Stime OLS per i parametri. La statistica generale del test per tale è:
ψ = Σ c j β j ψ 0 c = ( 0 , 1 ) ' β 2 = 0 μ 2 - μ 1 = 0 ψ = Σ ctψ=∑cjβjψ0c=(0,1)′β2=0μ2−μ1=0ψ^=∑cjβ^jβ^=(X′X)−1X′yψ
t=ψ^−ψ0σ^c′(X′X)−1c−−−−−−−−−√
‖e‖2Rank(X)=2σ^2=∥e∥2/(n−Rank(X)) è uno stimatore imparziale per la varianza dell'errore, dove è la somma dei residui quadrati. Nel caso di due gruppi , , e quindi gli stimatori sono e . Con nel nostro caso 1, la statistica del test diventa:
∥e∥2Rank(X)=2(X′X)−1X′=(.5−.5.5−.50.50.5)β^0=0.5y1+0.5y2=M1β^2=−0.5y1−0.5y2+0.5y3+0.5y4=M2−M1c′(X′X)−1c
t=M2−M1−0σ^=M2−M1∥e∥2/(n−2)−−−−−−−−−−√
t n - R a n k ( X ) n - 2 tt IS -distributed con df (qui ). Quando si piazza , si ottiene , la statistica del test ANOVA -test per due gruppi ( tra, per i gruppi) che segue una - distribuzione con 1 e df.tn−Rank(X)n−2t(M2−M1)2/1∥e∥2/(n−2)=SSb/dfbSSw/dfw=FFbwFn−Rank(X)
Con più di due gruppi, le ipotesi ANOVA (tutte sono contemporaneamente 0, con ) si riferiscono a più di un parametro e non possono essere espresse come una combinazione lineare , quindi i test non sono equivalenti . 1 ≤ j ψβj1≤jψ