Y=β0+β1X+εwhere ε∼N(0,σ2ε)
β0+β1Xσ2ε
σ2εXYεβ0, β1, σ2ε)Xσ2ε
Y=β0+β1X+εwhere ε∼N(0,f(X)) where f(X)=exp(γ0+γ1X)and γ1≠0
Xf(X) X
X. Tuttavia, tendo a pensare che guardare le trame sia il migliore. @Penquin_Knight ha fatto un buon lavoro nel mostrare quale sia la varianza costante tracciando i residui di un modello in cui l'omoscedasticità si ottiene rispetto ai valori adattati. L'eteroscedasticità può anche essere rilevata in un diagramma dei dati grezzi o in un diagramma a scala (chiamato anche livello di diffusione). R rappresenta convenientemente quest'ultimo con una chiamata a plot.lm(model, which=2)
; è la radice quadrata dei valori assoluti dei residui rispetto ai valori adattati, con una curva di basso valore utile sovrapposta. Vuoi che la vestibilità lowess sia piatta, non inclinata.
Considera i grafici seguenti, che confrontano il modo in cui i dati omoscedastici e eteroscedastici potrebbero apparire in questi tre diversi tipi di figure. Notare la forma dell'imbuto per i due grafici eteroscedastici superiori e la linea di basso profilo inclinata verso l'alto nell'ultima.
Per completezza, ecco il codice che ho usato per generare questi dati:
set.seed(5)
N = 500
b0 = 3
b1 = 0.4
s2 = 5
g1 = 1.5
g2 = 0.015
x = runif(N, min=0, max=100)
y_homo = b0 + b1*x + rnorm(N, mean=0, sd=sqrt(s2 ))
y_hetero = b0 + b1*x + rnorm(N, mean=0, sd=sqrt(exp(g1 + g2*x)))
mod.homo = lm(y_homo~x)
mod.hetero = lm(y_hetero~x)