Le mie previsioni provenienti da un modello di regressione logistica (glm in R) non sono limitate tra 0 e 1 come mi sarei aspettato. La mia comprensione della regressione logistica è che i parametri di input e modello sono combinati in modo lineare e la risposta viene trasformata in una probabilità utilizzando la funzione di collegamento logit. Poiché la funzione logit è limitata tra 0 e 1, mi aspettavo che le mie previsioni fossero limitate tra 0 e 1.
Tuttavia non è quello che vedo quando implemento la regressione logistica in R:
data(iris)
iris.sub <- subset(iris, Species%in%c("versicolor","virginica"))
model <- glm(Species ~ Sepal.Length + Sepal.Width, data = iris.sub,
family = binomial(link = "logit"))
hist(predict(model))
Semmai l'output di predict (modello) mi sembra normale. Qualcuno può spiegarmi perché i valori che ottengo non sono probabilità?