Il modello di regressione logistica è la massima verosimiglianza utilizzando il parametro naturale (rapporto log-odds) per contrastare le variazioni relative del rischio del risultato per differenza di unità nel predittore. Ciò presuppone, ovviamente, un modello di probabilità binomiale per il risultato. Ciò significa che le proprietà di coerenza e robustezza della regressione logistica si estendono direttamente dalla massima probabilità: robusta a mancante a dati casuali, coerenza root-n, esistenza e unicità delle soluzioni per la stima delle equazioni. Ciò presuppone che le soluzioni non si trovino ai limiti dello spazio dei parametri (dove i rapporti di probabilità del log sono ). Poiché la regressione logistica è la massima probabilità, la funzione di perdita è correlata alla probabilità, poiché sono problemi di ottimizzazione equivalenti.±∞
Con la quasilikelihood o la stima di equazioni (inferenza semiparametrica), l'esistenza, le proprietà di unicità sono ancora valide, ma il presupposto che il modello medio sia valido non è rilevante e l'inferenza e gli errori standard sono coerenti indipendentemente dalla mancata specificazione del modello. Quindi, in questo caso, non è una questione se il sigmoide sia la funzione corretta, ma uno che ci dà una tendenza in cui possiamo credere ed è parametrizzato da parametri che hanno un'interpretazione estensibile.
Il sigmoide, tuttavia, non è l'unica funzione di modellazione binaria in circolazione. La funzione probit più comunemente contrastata ha proprietà simili. Non stima i rapporti di probabilità del log, ma funzionalmente sembrano molto simili e tendono a dare approssimazioni molto simili alla stessa identica cosa . Non è nemmeno necessario utilizzare le proprietà di limitazione nella funzione del modello medio. Il semplice utilizzo di una curva di registro con una funzione di varianza binomiale fornisce una regressione del rischio relativa, un collegamento di identità con una varianza binomiale fornisce modelli di rischio additivi. Tutto ciò è determinato dall'utente. La popolarità della regressione logistica è, purtroppo, il motivo per cui è così comunemente usato. Tuttavia, ho i miei motivi (quelli che ho dichiarato) perché penso che sia ben giustificato per l'uso nella maggior parte delle circostanze binarie di modellizzazione dei risultati.
Nel mondo dell'inferenza, per esiti rari, il rapporto di probabilità può essere approssimativamente interpretato come un "rischio relativo", ovvero una "variazione percentuale relativa del rischio di risultato confrontando X + 1 con X". Questo non è sempre il caso e, in generale, un odds ratio non può e non deve essere interpretato come tale. Tuttavia, i parametri hanno interpretazione e possono essere facilmente comunicati ad altri ricercatori è un punto importante, qualcosa che purtroppo manca dai materiali didattici degli apprendenti della macchina.
Il modello di regressione logistica fornisce anche le basi concettuali per approcci più sofisticati come la modellazione gerarchica, nonché modelli misti e approcci di verosimiglianza condizionale che sono coerenti e robusti per un numero crescente di parametri di disturbo fastidioso. I GLMM e la regressione logistica condizionale sono concetti molto importanti nelle statistiche ad alta dimensione.