Un mio collega mi ha inviato questo problema apparentemente facendo il giro su Internet:
If $3 = 18, 4 = 32, 5 = 50, 6 = 72, 7 = 98$, Then, $10 =$ ?
La risposta sembra essere 200.
3*6
4*8
5*10
6*12
7*14
8*16
9*18
10*20=200
Quando eseguo una regressione lineare in R:
data <- data.frame(a=c(3,4,5,6,7), b=c(18,32,50,72,98))
lm1 <- lm(b~a, data=data)
new.data <- data.frame(a=c(10,20,30))
predict <- predict(lm1, newdata=new.data, interval='prediction')
Ottengo:
fit lwr upr
1 154 127.5518 180.4482
2 354 287.0626 420.9374
3 554 444.2602 663.7398
Quindi il mio modello lineare prevede .
Quando tracciamo i dati sembra lineare ... ma ovviamente ho assunto qualcosa che non è corretto.
Sto cercando di imparare a utilizzare al meglio i modelli lineari in R. Qual è il modo corretto di analizzare questa serie? Dove ho sbagliato?