Perché la regressione logistica è un classificatore lineare?


49

Poiché stiamo usando la funzione logistica per trasformare una combinazione lineare dell'input in un output non lineare, come può la regressione logistica essere considerata un classificatore lineare?

La regressione lineare è proprio come una rete neurale senza lo strato nascosto, quindi perché le reti neurali sono considerate classificatori non lineari e la regressione logistica è lineare?


7
La trasformazione di "una combinazione lineare dell'ingresso in un'uscita non lineare" è una parte fondamentale della definizione di un classificatore lineare . Ciò riduce questa domanda alla seconda parte, che equivale a dimostrare che le reti neurali non possono generalmente essere espresse come classificatori lineari.
whuber

1
@whuber: Come si spiega il fatto che un modello di regressione logistica può prendere variabili predittive polinomiali (ad es. ) per produrre un confine di decisione non lineare? È ancora un classificatore lineare? w1x12+w2x23
stackoverflowuser2010

4
@Stack Il concetto di "classificatore lineare" sembra aver origine con il concetto di un modello lineare. La "linearità" in un modello può assumere diverse forme, come descritto in stats.stackexchange.com/a/148713 . Se accettiamo la caratterizzazione di Wikipedia dei classificatori lineari , il tuo esempio polinomiale verrebbe visto come non lineare in termini di "caratteristiche" date e x 2 ma sarebbe lineare in termini di caratteristiche x 2 1 e x 3 2 . Questa distinzione fornisce un modo utile per sfruttare le proprietà della linearità.x1x2x12x23
whuber

1
Sono ancora un po 'confuso sulla domanda: il limite decisionale di un classificatore logistico è lineare? Ho seguito il corso di apprendimento automatico Andrew Ng su Coursera e ha menzionato quanto segue :! [Inserisci la descrizione dell'immagine qui ] ( i.stack.imgur.com/gHxfr.png ) Quindi in realtà mi sembra che non ci sia nessuno che risponda dipende dalla linearità o non linearità del limite di decisione, che dipende dalla funzione di ipotesi definita come Htheta (X) dove X è l'input e Theta è le variabili del nostro problema. Ha senso per te?
brokensword,

Risposte:


42

p^=11+eμ^, where μ^=θ^x.
μ^xx

x

{x:p^=0.5}θ^x=0


2
xθ

1
quindi anche dalla tua spiegazione. Possiamo dire che la predicazione della rete neurale è una funzione lineare delle attivazioni dell'ultimo livello nascosto?
Jack Twain,

2
θ^xθ^xxx

3
xx

3
@Pegah So che questo è vecchio, ma: la regressione logistica ha un limite di decisione lineare. L'output stesso non è ovviamente lineare, è logistico. A seconda di quale lato della linea cade un punto, l'output totale si avvicinerà (ma non raggiungerà mai) rispettivamente 0 o 1. E per aggiungere alla risposta di Stefan Wagners: l'ultima frase non è del tutto corretta, una rete neurale non è lineare quando contiene attivazioni o funzioni di uscita non lineari. Ma può anche essere lineare (nel caso in cui non siano state aggiunte non linearità).
Chris,

20

Come osserva Stefan Wagner, il limite decisionale per un classificatore logistico è lineare. (Il classificatore ha bisogno che gli input siano linearmente separabili.) Per questo volevo espandere la matematica nel caso non fosse ovvio.

11+eθx=0.5

1=eθx

e, prendendo il registro naturale di entrambi i lati,

0=θx=i=0nθixi

quindi il limite di decisione è lineare.

Il motivo per cui il limite di decisione per una rete neurale non è lineare è perché ci sono due strati di funzioni sigmoidi nella rete neurale: uno in ciascuno dei nodi di output più una funzione sigmoid aggiuntiva per combinare e soglie i risultati di ciascun nodo di output.


2
In realtà, puoi ottenere un limite di decisione non lineare con un solo livello con attivazione. Vedi l'esempio standard di un XOR con una rete feed-forward a 2 strati.
James Hirschorn,

5

C0C1

P(C0|x)=P(x|C0)P(C0)P(x)
P(C0|x)=P(x|C0)P(C0)P(x|C0)P(C0)+P(x|C1)P(C1)=11+exp(logP(x|C0)P(x|C1)logP(C0)P(C1))
1+eωx

P(x|Ci)=exp(θixb(θi)a(ϕ)+c(x,ϕ))
logP(x|C0)P(x|C1)=[(θ0θ1)xb(θ0)+b(θ1)]/a(ϕ)

Si noti che supponiamo che entrambe le distribuzioni appartengano alla stessa famiglia e abbiano gli stessi parametri di dispersione. Ma, sotto questo presupposto, la regressione logistica può modellare le probabilità per l'intera famiglia di distribuzioni esponenziali.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.