Esiste un dominio in cui le reti bayesiane superano le reti neurali?


48

Le reti neurali ottengono migliori risultati in compiti di visione artificiale (vedi MNIST , ILSVRC , Kaggle Galaxy Sfida ). Sembrano sovraperformare ogni altro approccio in Computer Vision. Ma ci sono anche altri compiti:

Non sono troppo sicuro dell'ASR (riconoscimento vocale automatico) e della traduzione automatica, ma penso di aver anche sentito che le reti (ricorrenti) neurali (iniziano a) superano altri approcci.

Attualmente sto imparando a conoscere le reti bayesiane e mi chiedo in quali casi questi modelli vengono generalmente applicati. Quindi la mia domanda è:

Esiste una competizione / competizione (Kaggle), in cui lo stato dell'arte sono le reti bayesiane o almeno modelli molto simili?

(Nota a margine : ho visto anche alberi delle decisioni , 2 , 3 , 4 , 5 , 6 , 7 vincere in diverse sfide Kaggle recenti)


Non è una questione di dominio. È una questione di quanti dati hai, quanto sono bravi i tuoi priori e se vuoi dei posteriori.
Emre,

1
@Emre Che è una questione di dominio ... (e, naturalmente, di denaro quando hai la possibilità non solo di utilizzare set di dati esistenti ma anche di assumere persone per creare / etichettare nuovi dati).
Martin Thoma,

Sarebbe una questione di dominio se esistessero delle proprietà dei dati, una struttura, che un algoritmo sfruttasse meglio dell'altro, ma non è quello che sto suggerendo.
Emre,

2
Quindi la risposta alla tua domanda è allora, No . Giusto? Perché tutte le risposte sembrano indicare i vantaggi delle reti bayesiane rispetto ad altri modelli predittivi, ma non ho visto alcuna competizione Kaggle in cui effettivamente superano altri modelli. Qualcuno può fornire uno? Perché tutti i motivi e i possibili vantaggi, ad esempio la mancanza di dati sufficienti e la scelta di buoni priori, forniti nelle risposte sembrano grandi in teoria, ma non rispondono ancora alla domanda fornendo, almeno, un esempio.
MNLR,

Una cosa che le reti bayesiane possono essere utili per l'apprendimento / compiti senza supervisione in cui la quantità di dati è relativamente limitata. Le reti neurali superano gli altri solo quando c'è un'enorme quantità di dati su cui allenarsi.
xji,

Risposte:


31

Una delle aree in cui vengono spesso utilizzati gli approcci bayesiani è quella in cui occorre interpretare il sistema di predizione. Non vuoi dare ai medici una rete neurale e dire che è preciso al 95%. Preferisci spiegare le ipotesi che il tuo metodo fa, nonché il processo decisionale che il metodo usa.

Un'area simile è quando si dispone di una solida conoscenza del dominio precedente e si desidera utilizzarla nel sistema.



Vedi anche: lime
Martin Thoma il

18

Le reti bayesiane e le reti neurali non si escludono a vicenda. In effetti, le reti bayesiane sono solo un altro termine per "modello grafico diretto". Possono essere molto utili nella progettazione di reti neurali di funzioni oggettive. Yann Lecun lo ha sottolineato qui: https://plus.google.com/+YannLeCunPhD/posts/gWE7Jca3Zoq .

Un esempio.

p(x)=zp(x|z)p(z)dz.
p(x|z)q(z|x)p(z|x)

Le due parti possono essere addestrate congiuntamente?
nn0p,

16

Ottime risposte già.

Un dominio a cui riesco a pensare, e su cui sto lavorando ampiamente, è il dominio di analisi dei clienti .

Devo capire e prevedere le mosse e le motivazioni dei clienti al fine di informare e avvertire sia il supporto clienti, il marketing e anche i team di crescita.

Quindi qui, le reti neurali fanno davvero un buon lavoro nella previsione di churn, ecc. Ma ho trovato e preferisco lo stile delle reti bayesiane, e qui ci sono i motivi per preferirlo:

  1. I clienti hanno sempre un modello. Hanno sempre un motivo per agire. E quella ragione sarebbe qualcosa che la mia squadra ha fatto per loro, o hanno imparato loro stessi. Quindi, tutto ha un precedente qui, e in effetti questa ragione è molto importante in quanto alimenta la maggior parte delle decisioni prese dal cliente.
  2. Ogni mossa da parte del cliente e dei team di crescita nell'imbuto di marketing / vendita è causa-effetto. Pertanto, la conoscenza preliminare è fondamentale quando si tratta di convertire un potenziale cliente in un cliente.

Quindi, il concetto di prior è molto importante quando si tratta di analisi dei clienti, il che rende il concetto di reti bayesiane molto importante per questo dominio.


Apprendimento suggerito:

Metodi bayesiani per reti neurali

Reti bayesiane nell'analisi aziendale


15

A volte ti interessa tanto cambiare il risultato quanto prevederlo.

Una rete neurale dotata di dati di allenamento sufficienti tenderà a prevedere meglio il risultato, ma una volta che è possibile prevederlo, è possibile prevedere l'effetto di apportare modifiche alle funzionalità di input sul risultato.

Un esempio dalla vita reale, sapere che è probabile che qualcuno abbia un attacco di cuore è utile, ma essere in grado di dire alla persona che se smettessero di fare XX, il rischio si ridurrebbe del 30% è di grande beneficio.

Allo stesso modo per la fidelizzazione dei clienti, sapere perché i clienti smettono di fare acquisti con te, vale tanto quanto prevedere i clienti che probabilmente smetteranno di fare acquisti con te.

Inoltre, una rete bayesiana più semplice che predice meno bene ma porta a intraprendere più azioni può spesso essere migliore di una rete bayesiana più "corretta".

Il più grande vantaggio delle reti bayesiane rispetto alle reti neurali è che possono essere utilizzate per l'inferenza causale. Questo ramo è di fondamentale importanza per la statistica e l'apprendimento automatico e Judea Pearl ha vinto il premio Turing per questa ricerca.


Ma le reti neurali possono anche essere utilizzate per determinare il ruolo e l'importanza delle diverse funzionalità, giusto?
Hossein,

7

Le reti bayesiane potrebbero sovraperformare le reti neurali con impostazioni di piccoli dati. Se le informazioni precedenti sono gestite correttamente tramite la struttura della rete, i priori e altri iperparametri, potrebbero avere un vantaggio rispetto alle reti neurali. Le reti neurali, in particolare quelle con più livelli, sono molto note per essere affamate di dati. Quasi per definizione sono necessari molti dati per addestrarli correttamente.


4

Ho pubblicato questo link su Reddit e ho ricevuto molti feedback. Alcuni hanno pubblicato le loro risposte qui, altri no. Questa risposta dovrebbe riassumere il post reddit. (L'ho creato wiki della community, in modo da non ottenere punti per questo)



2

Ho fatto un piccolo esempio per questo una volta. Da ciò, penso che le reti bayesiane siano preferite se si desidera acquisire una distribuzione, ma il set di training di input non copre bene la distribuzione. In tali casi, anche una rete neurale ben generalizzata non sarebbe in grado di ricostruire la distribuzione.


-3

Non sono assolutamente d'accordo sul fatto che le reti neurali facciano bene agli altri studenti. In effetti le reti neurali stanno andando piuttosto male rispetto ad altri metodi. Non esiste inoltre alcuna metodologia, nonostante alcuni consigli sulla scelta dei parametri, fatto questo molto spesso per caso. Ci sono anche alcuni tizi che parlano a caso nei forum di come le reti neurali sono così buone, non perché hanno alcune prove a riguardo, ma perché sono attratte dalla parola fantasia e ronzio, neurale ''. Sono anche molto instabili, hai provato una rete neurale da confrontare con xgboost? Non proverò alcuna rete neurale fino a quando non sarà autocosciente. Quindi fino ad allora felice rete neurale :)


3
Questo è troppo vago e colloquiale per dare una buona risposta. Alcuni dettagli, fatti e modifiche lo migliorerebbero.
Sean Owen,

"I fatti specifici" dovrebbero essere specificati dalle persone che pubblicano messaggi del genere che affermano che le reti neurali sono le migliori, non si può dire che le reti neurali stiano andando bene solo perché sembrano fantasiose, ci sono anche set di dati in cui probabilmente le reti neurali lo fanno male in modo tale che Knn sta ottenendo risultati molto migliori.
GM1

1
Anche se non nego le tue opinioni, non dovresti anche che la tua risposta non risponda realmente alla domanda. Quindi, considera di aggiungerlo come commento. E, per favore, aggiungi qualsiasi prova concreta e teoria a sostegno della tua risposta, altrimenti potrebbe essere guardata, come un rant, dai futuri spettatori :)
Dawny33

1
@ gm1 Immagino che mi intendessi con ",, Fatti specifici" che dovrebbero essere specificati da persone che pubblicano messaggi del genere che affermano che le reti neurali sono le migliori ". Si prega di notare che non ho scritto una dichiarazione che fosse quella generale. Ho scritto che NN vince in molti concorsi / compiti CV. E ho aggiunto un paio di sfide in cui gli approcci alle reti neurali hanno vinto.
Martin Thoma,

Ciao, ci sono ovviamente alcune competizioni di Kaggle in cui le reti neurali hanno fatto bene (supponendo che non abbiano usato reti neurali in combinazione con altri modelli), ma questa è una piccola parte di tutte le competizioni di Kaggle, potresti usare una rete neurale per andare TOP 3 in Kaggle TFI? Penso di essere in grado di fare sia per LB pubblici che privati ​​con un modello non lineare.
GM1
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.