Regressione logistica e punto di flesso

11

Abbiamo dati con esito binario e alcune covariate. Ho usato la regressione logistica per modellare i dati. Solo una semplice analisi, niente di straordinario. L'output finale dovrebbe essere una curva dose-risposta in cui mostriamo come cambia la probabilità per una specifica covariata. Qualcosa come questo:

inserisci qui la descrizione dell'immagine

Abbiamo ricevuto alcune critiche da un revisore interno (non un puro statistico) per aver scelto la regressione logistica. La regressione logistica presuppone (o definisce) che il punto di flesso della curva a forma di S sulla scala di probabilità sia a probabilità 0,5. Ha sostenuto che non ci sarebbe motivo di ritenere che il punto di flesso fosse effettivamente alla probabilità 0,5 e che dovremmo scegliere un modello di regressione diverso che consenta al punto di flesso di variare in modo tale che la posizione effettiva sia guidata dai dati.

All'inizio sono stato colto di sorpresa dalle sue argomentazioni, dal momento che non ho mai pensato a questo punto. Non avevo alcun argomento sul perché sarebbe giustificato supporre che il punto di flesso sia a 0,5. Dopo aver fatto qualche ricerca, non ho ancora una risposta a questa domanda.

Mi sono imbattuto in una regressione logistica a 5 parametri, per cui il punto di flesso è un parametro aggiuntivo, ma sembra che questo modello di regressione venga solitamente utilizzato quando si producono curve dose-risposta con un risultato continuo. Non sono sicuro se e come possa essere esteso alle variabili di risposta binarie.

Immagino che la mia domanda principale sia perché o quando è OK supporre che il punto di flesso per una regressione logistica sia a 0,5? Importa anche? Non ho mai visto nessuno adattarsi a un modello di regressione logistica e discutere esplicitamente della questione del punto di flesso. Esistono alternative per creare una curva di risposta alla dose in cui il punto di flesso non è necessariamente a 0,5?

Solo per completezza, il codice R per generare l'immagine sopra:

dat <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv")
dat$rank <- factor(dat$rank)
logit <- glm(admit ~ gre + gpa + rank, family = binomial(link = "logit"), data = dat)
newdata <- data.frame(gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4)))
pp <- predict(logit, newdata, type = "response", se.fit = TRUE)
plot(newdata$gre, pp$fit, type="l", col="black", lwd=2,ylab="Probability", xlab="Dose")

Modifica 1:

Solo per aggiungere a ciò che Scortchi ha detto in uno dei commenti: il recensore ha effettivamente sostenuto che biologicamente potrebbe essere più probabile che il cambiamento nella curvatura avvenga prima dello 0,5. Pertanto la sua resistenza a supporre che il punto di flesso sia a 0,5.

Modifica 2:

Come reazione al commento di Frank Harrell:

Ad esempio, ho modificato il mio modello sopra per includere un termine quadratico e un cubo gre(che è la "dose" in questo esempio).

logit <- glm(admit ~ gre+I(gre^2)+I(gre^3)+  gpa + rank, family = binomial(link = "logit"), data = dat)
newdata <- data.frame(admit=1, gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4)))
pp <- predict(logit, newdata, type = "response", se.fit = TRUE)
plot(newdata$gre, pp$fit, type="l", col="black", lwd=2,xlim=c(-2000,4000),ylab="Probability", xlab="Dose")

inserisci qui la descrizione dell'immagine

Nonostante il fatto che probabilmente non sia significativo aggiungere un termine quadratico e un gretermine cubico in questo caso, vediamo che la forma della curva dose-risposta è cambiata. In effetti ora abbiamo due punti di flesso a circa 0,25 e vicino a 0,7.

— Francesco
fonte

2

Non è lo stesso che chiedere di investigare le relazioni non lineari dei predittori con le probabilità di risposta del log?

— Scortchi - Ripristina Monica

8

Come toccato da @scortchi, il revisore stava operando con la falsa impressione che non fosse possibile modellare gli effetti non lineari dei predittori sulla scala logit nel contesto della regressione logistica. Il modello originale ha assunto rapidamente la linearità di tutti i predittori. Rilassando l'assunto di linearità, usando ad esempio spline cubiche ristrette (spline naturali), l'intera forma della curva è flessibile e il punto di flesso non è più un problema. Se ci fosse stato un singolo predittore e fosse stato ampliato usando una spline di regressione, si potrebbe dire che il modello logistico fa solo le ipotesi di scorrevolezza e indipendenza delle osservazioni.

— Frank Harrell
fonte

Devo ammettere che non ho molta familiarità con la regressione della spline. Come avrei potuto fare questo insieme alla regressione logistica (in R). Ho modificato il mio post originale (modifica 2) per includere termini polinomiali nel predittore. Potrei usarlo come alternativa al livellamento della spline. Ovviamente non ho la stessa flessibilità che avrei con le spline.

— Francesco,

1

@Franco: le strategie di modellazione della regressione di Frank Harrell - libro , sito Web , pacchetto R - dovrebbero farti andare avanti. Una breve discussione di alcuni dei vantaggi delle spline di regressione è qui ; ma hai ovviamente ragione che i polinomi sono un'alternativa.

— Scortchi - Ripristina Monica

4

Mi sembra che il recensore stesse solo cercando qualcosa da dire. Prima di esaminare tali caratteristiche della specifica come il punto di flesso implicito, ci sono un sacco di ipotesi che abbiamo fatto, al fine di arrivare a un modello stimabile. Tutto potrebbe essere messo in discussione e discusso: l'uso della funzione logistica stessa è un possibile obiettivo primario: chi ci ha detto che la distribuzione condizionale del termine di errore sottostante è logistica? Nessuno.

Quindi il problema è: cosa significa il cambiamento di curvatura? Quanto è importante per il fenomeno del mondo reale in studio, potrebbe essere il punto in cui questo cambiamento di curvatura avviene, in modo da prendere in considerazione l'idea di renderlo "guidato dai dati"? Allontanarsi ulteriormente dal principio di parsimonia?

La domanda non è "perché il punto di flesso dovrebbe essere a 0,5?" Ma "quanto potrebbe essere fuorviante per le nostre conclusioni se lasciato a 0,5?".

— Alecos Papadopoulos
fonte

2

Sembra un po 'inesplorabile. Non sappiamo che il revisore non avesse buone ragioni per contestare questo assunto piuttosto che altri che avrebbe potuto contestare. Lasciare da parte uno strano modo di dirlo in termini di punti di flesso, e un possibile malinteso sulla regressione logistica, e in pratica si sta chiedendo perché il modello permetta alla curva di spostarsi e allungarsi ma non piegarsi, il che potrebbe meritare una risposta.

— Scortchi - Ripristina Monica

@Scortchi "strano modo di dirlo" ... "un possibile malinteso sulla regressione logistica" ... Se questo è ciò che serve per razionalizzare la critica del recensore, non avrebbe dovuto rivedere il documento dopo tutto.

— Alecos Papadopoulos,

1

Come con @Scortchi lo trovo un po 'troppo nitido. Molte delle persone più attive qui hanno esperienze in varie scienze piuttosto che nelle statistiche tradizionali. Essere uno statistico, puro o meno, non è né essenziale né sufficiente per dare buoni consigli (anche se in quasi tutti i casi manifestamente aiuterà).

— Nick Cox,

@ Nick Cox Accetto la "nitidezza" e ho appena cancellato la mia ultima frase, in segno di consenso. Il mio punto è che mettere in discussione in modo generale le ipotesi di un modello non ha valore: i modelli sono sempre falsi. Quindi, se la probabilità in cui la curvatura cambia è in qualche modo critica per il fenomeno del mondo reale allo studio, allora il revisore aveva davvero ragione a chiedere che questo punto fosse guidato dai dati. Ma se il recensore ha appena commentato "perché a p = 0,5 e non altrove?", Questo commento non è costruttivo.

— Alecos Papadopoulos,

2

Grazie per questo. Concordo con la tua posizione generale: (a) discussione sui meriti dei diversi approcci e (b) discussione su come dovremmo discutere di questi due aspetti sono equi. I commenti su singoli o addirittura gruppi non sono di solito utili (anche se a volte esco oltrepassando il limite per esasperazione ...).

— Nick Cox,

0

In mho, la regressione del logit è una scelta ragionevole per la risposta alla dose. Ovviamente, puoi usare probit, log-log, c-log-log link e confrontare la bontà di adattamento (DEV, BIC, CAIC, ecc.). Ma la regressione logit più semplice fornisce una comoda valutazione formale del punto di flesso LD50 = -b0 / b1. Ricordiamo che si tratta di un punto specifico, per il quale otteniamo la minima incertezza (cfr. LD16, LD84 e tutti gli altri avranno un CI più ampio, vedi "Analisi Probit" di Finney, 1947, 1977). Nella mia esperienza, sempre (?) Era meglio usare il logaritmo della dose, quindi convertire semplicemente l'IC al 95% nella scala originale. Qual è la natura delle altre covariate nel modello? Alludo alla possibilità di usare un approccio multi-modello ... Certamente le spline sono flessibili, ma i parametri formali sono interpretati più facilmente!

Vedi http://www.epa.gov/ncea/bmds/bmds_training/software/overp.htm

— Ivan Kshnyasev
fonte

0

Il punto di flesso 0,5 è una piccola parte di una domanda più ampia: l'equazione logistica è simmetrica per costruzione. E nella maggior parte delle sue derivate, l'effetto modellato ha una ragione per essere simmetrico. ad es. quando un giocatore vince l'altro giocatore perde, o l'effetto responsabile della saturazione è lo stesso effetto fisico responsabile della crescita iniziale, ecc. Quindi, se c'è una ragione per cui l'origine del comportamento X basso è la stessa origine poiché la mano destra si comporta bene o per qualsiasi altra ragione il problema è simmetrico, allora hai la tua giustificazione.

in caso contrario, forse il prossimo modello più semplice è l'equazione logistica generalizzata. ha più parametri e potresti voler aggiungere un vincolo in modo che non siano tutti parametri gratuiti. questo è probabilmente più desiderabile dei kludges che hai aggiunto perché quelli stanno aggiungendo scaffali in cui la prima derivata oscilla avanti e indietro - quel genere di cose tende a creare falsi punti immaginari di equilibrio locale se stai cercando di ottimizzare un valore di aspettativa di questo distribuzione. la forma generalizzata romperà la simmetria ma in modo regolare.

— Charlie Strauss
fonte