Qual è la differenza tra regressione binomiale e regressione logistica?


20

Ho sempre pensato alla regressione logistica come semplicemente un caso speciale di regressione binomiale in cui la funzione di collegamento è la funzione logistica (anziché, diciamo, una funzione probit).

Dalla lettura delle risposte su un'altra domanda che ho avuto, tuttavia, sembra che potrei essere confuso, e c'è una differenza tra regressione logistica e regressione binomiale con un collegamento logistico.

Qual è la differenza?

Risposte:


13

La regressione logistica è una regressione binomiale con la funzione di collegamento "logistica":

g(p)=log(p1p)=Xβ

Anche se penso anche che la regressione logistica sia solitamente applicata alle proporzioni binomiali piuttosto che ai conteggi binomiali.


1
Cosa intendi per regressione logistica che viene solitamente applicata alle proporzioni piuttosto che ai conteggi? Supponiamo che io stia provando a prevedere se le persone parteciperanno o meno a una festa e che per una particolare festa, so che 9 persone hanno partecipato e 1 no - vuoi dire che la regressione logistica prende questo come esempio di formazione (ad es. questa parte ha avuto un tasso di successo di 0,9), mentre la regressione binomiale con un link lo prenderebbe come 10 esempi di allenamento (9 successi, 1 fallimento)?
Raegtin,

@raehtin - in entrambi i casi sarebbe caso campione / training, con ( n i , f i ) = ( 10 , 0.9 ) e ( n i , x i ) = ( 10 , 9 ) rispettivamente. La differenza è la forma della media e le funzioni di varianza. Per il binomio, la media è μ i = n i p i , il collegamento canoncial ora è log ( μ i1(ni,fi)=(10,0.9)(ni,xi)=(10,9)μi=nipi(chiamato anche "parametro naturale") e la funzione di varianza èV(μi)=μi(ni-μi)log(μiniμi) con parametro di dispersioneϕi=1. Per la logistica abbiamo mediaμi=pi, il link sopra, funzione di varianza diV(μi)=μi(1-μi)e dispersione uguale aϕi=1V(μi)=μi(niμi)niϕi=1μi=piV(μi)=μi(1μi) . ϕi=1ni
Probislogic,

Con la logistica, è separato dalle funzioni di media e varianza, quindi può essere più facilmente preso in considerazione tramite ponderazioneni
probabilitlog

Ah, capito, penso di vedere. Questo significa che producono risultati equivalenti (semplicemente arrivati ​​da un modo diverso)?
Raegtin,

1
@raegtin - Penso di sì. I pesi GLM, , sono uguali in entrambi i casi, e la funzione di collegamento produce lo stesso valore logit. Quindi fintanto che anche le variabili X sono uguali, dovrebbe dare gli stessi risultati. wi2=1ϕiV(μi)[g(μi)]2
Probislogic,

4

Regressione binomiale è un qualsiasi tipo di GLM utilizzando una relazione media-varianza binomio dove la varianza è data da . Nella regressione logistica della Y = logit - 1 ( X β ) = 1 / ( 1 - exp ( X β ) )var(Y)=Y^(1Y^)Y^=logit1(Xβ^)=1/(1exp(Xβ^))con la funzione logit detta funzione "link". Tuttavia, una classe generale di modelli di regressione binomiale può essere definita con qualsiasi tipo di funzione di collegamento, anche con funzioni che generano un intervallo al di fuori di . Ad esempio, la regressione probit prende un link del CDF normale inverso, la regressione del rischio relativo prende come link la funzione log e i modelli di rischio additivo prendono il modello del link identità.[0,1]

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.