Comprensione delle previsioni dalla regressione logistica


13

Le mie previsioni provenienti da un modello di regressione logistica (glm in R) non sono limitate tra 0 e 1 come mi sarei aspettato. La mia comprensione della regressione logistica è che i parametri di input e modello sono combinati in modo lineare e la risposta viene trasformata in una probabilità utilizzando la funzione di collegamento logit. Poiché la funzione logit è limitata tra 0 e 1, mi aspettavo che le mie previsioni fossero limitate tra 0 e 1.

Tuttavia non è quello che vedo quando implemento la regressione logistica in R:

data(iris)
iris.sub <- subset(iris, Species%in%c("versicolor","virginica"))
model    <- glm(Species ~ Sepal.Length + Sepal.Width, data = iris.sub, 
                family = binomial(link = "logit"))
hist(predict(model))

inserisci qui la descrizione dell'immagine

Semmai l'output di predict (modello) mi sembra normale. Qualcuno può spiegarmi perché i valori che ottengo non sono probabilità?


3
La risposta di Corone qui sotto copre i dettagli molto bene. La figura originale che hai sopra presenta i valori delle probabilità di registro sull'asse x, che possono essere matematicamente trasformati in probabilità (cioè secondo la risposta di Corone, passando attraverso la funzione di collegamento).
James Stanley

Risposte:


16

Il predict.glmmetodo per impostazione predefinita restituisce i predittori sulla scala del predittore lineare. Cioè non hanno ancora attraversato la funzione di collegamento.

Provare

hist(predict(model, type = "response"))

anziché

inserisci qui la descrizione dell'immagine


4
Hai fatto un ottimo lavoro padroneggiando le nostre capacità di markup e illustrazione in breve tempo: questa risposta ne è un buon esempio. Molto bene!
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.