Test della non linearità nella regressione logistica (o altre forme di regressione)


13

Uno dei presupposti della regressione logistica è la linearità nel logit. Quindi una volta che ho messo in moto il mio modello ho testato la non linearità usando il test Box-Tidwell. Uno dei miei predittori continui (X) è risultato positivo alla non linearità. Cosa dovrei fare dopo?

Poiché si tratta di una violazione delle ipotesi, dovrò liberarmi del predittore (X) o includere la trasformazione non lineare (X * X). O trasforma la variabile in una categoria? Se hai un riferimento potresti indicarmi anche quello?

Risposte:


8

Suggerirei di usare spline cubiche con restrizioni ( rcsin R, vedi i pacchetti Hmisc e Design per esempi di utilizzo), invece di aggiungere la potenza di nel tuo modello. Questo approccio è quello raccomandato da Frank Harrell, per esempio, e troverai una bella illustrazione nelle sue dispense (§2.5 e cap. 9) sulle strategie di modellazione della regressione (vedi il sito web del compagno ).X

È possibile confrontare i risultati con il test di Box-Tidwell tramite boxTidwell()nella macchina pacchetto.

Trasformare i predittori continui in categoriali non è generalmente una buona idea, vedere ad esempio i problemi causati dalla categorizzazione delle variabili continue .


5

Esso può essere opportuno includere una trasformazione non lineare di x , ma probabilmente non semplicemente x × x , vale a dire x 2 . Credo che potresti trovare questo utile riferimento nel determinare quale trasformazione utilizzare:

GEP Box e Paul W. Tidwell (1962). Trasformazione delle variabili indipendenti. Technometrics Volume 4 Numero 4, pagine 531-550. http://www.jstor.org/stable/1266288

Alcuni considerano la famiglia di trasformazioni Box-Tidwell più generale di quanto spesso sia appropriata per l'interpretazione e la parsimonia. Patrick Royston e Doug Altman hanno introdotto il termine polinomi frazionari per trasformazioni di Box-Tidwell con semplici poteri razionali in un autorevole articolo del 1994:

P. Royston e DG Altman (1994). Regressione usando polinomi frazionari di covariate continue: modellistica parametrica parsimoniosa. Statistica applicata Volume 43: pagine 429–467. http://www.jstor.org/stable/2986270

Patrick Royston in particolare ha continuato a lavorare e pubblicare sia articoli che software su questo, culminando in un libro con Willi Sauerbrei:

P. Royston e W. Sauerbrei (2008). Creazione di modelli multivariabili: un approccio pragmatico all'analisi della regressione basata su polinomi frazionali per la modellazione di variabili continue . Chichester, Regno Unito: Wiley. ISBN 978-0-470-02842-1


4

Non dimenticare di verificare le interazioni tra X e altre variabili indipendenti. Lasciare le interazioni non modificate può far sembrare che X abbia un effetto non lineare quando ha semplicemente un effetto non additivo.


Buon punto. Mi sono imbattuto solo nel contrario: assumere un effetto è lineare quando non lo è può portare a prove statistiche spurie per termini di interazione moltiplicativa.
onestop,

1
@onestop, hai un riferimento a riguardo? Ci credo, ma ho difficoltà a capire esattamente perché ciò accada.
Macro,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.