Nel rispondere a questa domanda John Christie ha suggerito che l'adattamento di modelli di regressione logistica dovrebbe essere valutata attraverso la valutazione dei residui. Conosco bene come interpretare i residui in OLS, sono nella stessa scala del DV e molto chiaramente la differenza tra ye y prevista dal modello. Tuttavia, per la regressione logistica, in passato in genere ho appena esaminato le stime di adattamento del modello, ad esempio AIC, perché non ero sicuro di cosa significhi un residuo per una regressione logistica. Dopo aver guardato in aiuto di R file un po 'vedo che in R ci sono cinque tipi di residui GLM disponibili, c("deviance", "pearson", "working","response", "partial")
. Il file della guida si riferisce a:
- Davison, AC e Snell, EJ (1991) Residui e diagnostica. In: Teoria statistica e modellistica. In onore di Sir David Cox, FRS , eds. Hinkley, DV, Reid, N. e Snell, EJ, Chapman & Hall.
Non ne ho una copia. C'è un modo breve per descrivere come interpretare ciascuno di questi tipi? In un contesto logistico, la somma dei residui quadrati fornirà una misura significativa dell'adattamento del modello o si sta meglio con un criterio informativo?
binnedplot
funzione nel braccio del pacchetto R fornisca una trama molto utile di residui. È ben descritto a pag.97-101 di Gelman e Hill 2007 .