Ho iniziato a scavare un po 'nella funzione plot.lm , questa funzione fornisce sei grafici per lm, sono:
- un diagramma di residui contro valori adattati
- un grafico in scala di posizione di sqrt (| residui |) rispetto ai valori adattati
- un diagramma QQ normale, un diagramma delle distanze di Cook rispetto alle etichette delle righe
- un complotto di residui contro le leve
- un diagramma delle distanze di Cook contro la leva / (1 leva)
E mi chiedo quali altre estensioni comuni / utili dei grafici attuali esistono per i modelli lineari, e come possono essere fatte in R? (anche i link agli articoli dei pacchetti sono i benvenuti)
Quindi la funzione boxcox (da {MASS}) è un esempio di un altro diagramma diagnostico utile (e tale risposta sarebbe ottima), tuttavia, sono più curioso di variazioni / estensioni su grafici diagnostici predefiniti esistenti per lm in R (sebbene generale altre osservazioni sull'argomento sono sempre ben accette).
Ecco alcuni semplici esempi di cosa intendo:
#Some example code for all of us to refer to
set.seed(2542)
x1 <- rnorm(100)
x2 <- runif(100, -2,2)
eps <- rnorm(100,0,2)
y <- 1 + 2*x1 + 3*x2 + eps
y[1:4] <- 14 # adding some contaminated points
fit <- lm(y~x1+x2)
#plot(y~x1+x2)
#summary(fit)
Tracciare i residui rispetto a ciascuno dei potenziali x
plot(resid(fit)~x1); abline (h = 0)
plot(resid(fit)~x2); abline (h = 0)
# plot(resid(fit)~x1+x2) # you can also use this, but then you wouldn't be able to use the abline on any plot but the last one
Per aggiungere la linea 0-1 (come si chiama questa linea in inglese ?!) al qqplot in modo da vedere quanto la qqline si discosta da esso
plot(fit, which = 2); abline(0,1, col = "green")
Tracciare la trama qq usando i residui esternalizzati
# plot(fit, which = 2); abline(0,1, col = "green") # The next command is just like this one
qqnorm(rstandard(fit), ylim = c(-2.2,4.2)); qqline(rstudent(fit), lty = 2) ;abline(0,1, col = "green")
qqnorm(rstudent(fit), ylim = c(-2.2,4.2)); qqline(rstudent(fit), lty = 2) ;abline(0,1, col = "green")
# We can note how the "bad" points are more extreme when using the rstudent