Se l'Hosmer-Lemeshow indica una mancanza di adattamento ma l'AIC è il più basso tra tutti i modelli .... dovresti comunque usare il modello?
Se elimino una variabile, la statistica di Hosmer-Lemeshow non è significativa (il che significa che non vi è una grave mancanza di adattamento). Ma l'AIC aumenta.
Modifica : penso in generale, se gli AIC di diversi modelli sono vicini (cioè ) l'uno all'altro, sono sostanzialmente gli stessi. Ma gli AIC sono molto diversi. Questo sembra indicare che quello con l'AIC più basso è quello che dovrei usare anche se il test di Hosmer-Lemeshow indica diversamente.
Inoltre, forse il test HL si applica solo a campioni di grandi dimensioni? Ha una bassa potenza per campioni di piccole dimensioni (la mia dimensione del campione è ~ 300). Ma se sto ottenendo un risultato significativo ... Ciò significa che anche con una bassa potenza ottengo un rifiuto.
Farebbe differenza se avessi usato AICc contro AIC? Come si ottengono gli AICc in SAS? So che potrebbero esserci problemi con la molteplicità. Ma a priori ipotizzo che le variabili abbiano un effetto sul risultato.
Qualche commento?
Edit2 : Penso che dovrei usare il modello con una variabile in meno e l'AIC più alto con HL non significativo. Il motivo è perché due delle variabili sono correlate tra loro. Quindi sbarazzarsi di uno ha senso.