Abbiamo dati con esito binario e alcune covariate. Ho usato la regressione logistica per modellare i dati. Solo una semplice analisi, niente di straordinario. L'output finale dovrebbe essere una curva dose-risposta in cui mostriamo come cambia la probabilità per una specifica covariata. Qualcosa come questo:

Abbiamo ricevuto alcune critiche da un revisore interno (non un puro statistico) per aver scelto la regressione logistica. La regressione logistica presuppone (o definisce) che il punto di flesso della curva a forma di S sulla scala di probabilità sia a probabilità 0,5. Ha sostenuto che non ci sarebbe motivo di ritenere che il punto di flesso fosse effettivamente alla probabilità 0,5 e che dovremmo scegliere un modello di regressione diverso che consenta al punto di flesso di variare in modo tale che la posizione effettiva sia guidata dai dati.
All'inizio sono stato colto di sorpresa dalle sue argomentazioni, dal momento che non ho mai pensato a questo punto. Non avevo alcun argomento sul perché sarebbe giustificato supporre che il punto di flesso sia a 0,5. Dopo aver fatto qualche ricerca, non ho ancora una risposta a questa domanda.
Mi sono imbattuto in una regressione logistica a 5 parametri, per cui il punto di flesso è un parametro aggiuntivo, ma sembra che questo modello di regressione venga solitamente utilizzato quando si producono curve dose-risposta con un risultato continuo. Non sono sicuro se e come possa essere esteso alle variabili di risposta binarie.
Immagino che la mia domanda principale sia perché o quando è OK supporre che il punto di flesso per una regressione logistica sia a 0,5? Importa anche? Non ho mai visto nessuno adattarsi a un modello di regressione logistica e discutere esplicitamente della questione del punto di flesso. Esistono alternative per creare una curva di risposta alla dose in cui il punto di flesso non è necessariamente a 0,5?
Solo per completezza, il codice R per generare l'immagine sopra:
dat <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv")
dat$rank <- factor(dat$rank)
logit <- glm(admit ~ gre + gpa + rank, family = binomial(link = "logit"), data = dat)
newdata <- data.frame(gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4)))
pp <- predict(logit, newdata, type = "response", se.fit = TRUE)
plot(newdata$gre, pp$fit, type="l", col="black", lwd=2,ylab="Probability", xlab="Dose")
Modifica 1:
Solo per aggiungere a ciò che Scortchi ha detto in uno dei commenti: il recensore ha effettivamente sostenuto che biologicamente potrebbe essere più probabile che il cambiamento nella curvatura avvenga prima dello 0,5. Pertanto la sua resistenza a supporre che il punto di flesso sia a 0,5.
Modifica 2:
Come reazione al commento di Frank Harrell:
Ad esempio, ho modificato il mio modello sopra per includere un termine quadratico e un cubo gre(che è la "dose" in questo esempio).
logit <- glm(admit ~ gre+I(gre^2)+I(gre^3)+ gpa + rank, family = binomial(link = "logit"), data = dat)
newdata <- data.frame(admit=1, gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4)))
pp <- predict(logit, newdata, type = "response", se.fit = TRUE)
plot(newdata$gre, pp$fit, type="l", col="black", lwd=2,xlim=c(-2000,4000),ylab="Probability", xlab="Dose")

Nonostante il fatto che probabilmente non sia significativo aggiungere un termine quadratico e un gretermine cubico in questo caso, vediamo che la forma della curva dose-risposta è cambiata. In effetti ora abbiamo due punti di flesso a circa 0,25 e vicino a 0,7.