Sto conducendo una regressione logistica con un risultato binario (inizio e non inizio). Il mio mix di predittori sono tutte variabili continue o dicotomiche.
Utilizzando l'approccio Box-Tidwell, uno dei miei predittori continui potenzialmente viola l'assunzione di linearità del logit. Non ci sono indicazioni da statistiche sulla bontà di adattamento che siano problematiche.
Successivamente ho eseguito nuovamente il modello di regressione, sostituendo la variabile continua originale con: in primo luogo, una trasformazione a radice quadrata e, in secondo luogo, una versione dicotomica della variabile.
All'ispezione dell'output, sembra che la bontà di adattamento migliora marginalmente ma i residui diventano problematici. Le stime dei parametri, gli errori standard e rimangono relativamente simili. L'interpretazione dei dati non cambia in termini di mia ipotesi, attraverso i 3 modelli.
Pertanto, in termini di utilità dei miei risultati e senso di interpretazione dei dati, sembra appropriato riportare il modello di regressione utilizzando la variabile continua originale.
Mi chiedo questo:
- Quando la regressione logistica è robusta contro la potenziale violazione della linearità dell'assunzione del logit?
- Dato il mio esempio sopra, sembra accettabile includere la variabile continua originale nel modello?
- Ci sono riferimenti o guide là fuori per raccomandare quando è soddisfacente accettare che il modello sia solido contro la potenziale violazione della linearità del logit?