Stavo sperimentando la relazione tra gli errori e i residui usando alcune semplici simulazioni in R. Una cosa che ho scoperto è che, indipendentemente dalla dimensione del campione o dalla varianza dell'errore, ottengo sempre esattamente per la pendenza quando si adatta il modello
Ecco la simulazione che stavo facendo:
n <- 10
s <- 2.7
x <- rnorm(n)
e <- rnorm(n,sd=s)
y <- 0.3 + 1.2*x + e
model <- lm(y ~ x)
r <- model$res
summary( lm(e ~ r) )
e
e r
sono altamente (ma non perfettamente) correlati, anche per piccoli campioni, ma non riesco a capire perché ciò avvenga automaticamente. Una spiegazione matematica o geometrica sarebbe apprezzata.
lm(y~r)
,lm(e~r)
elm(r~r)
che pertanto devono essere tutte uguali. Quest'ultimo ovviamente è . Prova tutti e tre questi comandi per vedere. Per far funzionare l'ultimo è necessario crearne una copia , ad esempio . Per ulteriori informazioni sui diagrammi geometrici di regressione, consultare stats.stackexchange.com/a/113207 .R
r
s<-r;lm(r~s)