In generale il classificatore ingenuo di Bayes non è lineare, ma se i fattori di probabilità provengono da famiglie esponenziali , il classificatore ingenuo di Bayes corrisponde a un classificatore lineare in un particolare spazio di caratteristiche. Ecco come vedere questo.p ( xio∣ c )
Puoi scrivere qualsiasi classificatore Bayes ingenuo come *
p(c=1∣x)=σ(∑ilogp(xi∣c=1)p(xi∣c=0)+logp(c=1)p(c=0)),
dove è la funzione logistica . Se p ( x i ∣ c ) proviene da una famiglia esponenziale, possiamo scriverlo comeσp(xi∣c)
p(xi∣c)=hi(xi)exp(u⊤icϕi(xi)−Ai(uic)),
e quindi
p(c=1∣x)=σ(∑iw⊤iϕi(xi)+b),
dove
wib=ui1−ui0,=logp(c=1)p(c=0)−∑i(Ai(ui1)−Ai(ui0)).
Si noti che questo è simile alla regressione logistica - un classificatore lineare - nello spazio delle caratteristiche definito da . Per più di due classi, otteniamo analogamente la regressione logistica multinomiale (o softmax) .ϕi
Se è gaussiano, allora ϕ i ( x i ) = ( x i , x 2 i ) e dovremmo avere
w i 1p(xi∣c)ϕi(xi)=(xi,x2i)
wi1wi2bi=σ−21μ1−σ−20μ0,=2σ−20−2σ−21,=logσ0−logσ1,
assumendo .p(c=1)=p(c=0)=12
* Ecco come derivare questo risultato:
p(c=1∣x)=p(x∣c=1)p(c=1)p(x∣c=1)p(c=1)+p(x∣c=0)p(c=0)=11+p(x∣c=0)p(c=0)p(x∣c=1)p(c=1)=11+exp(−logp(x∣c=1)p(c=1)p(x∣c=0)p(c=0))=σ(∑ilogp(xi∣c=1)p(xi∣c=0)+logp(c=1)p(c=0))