Quando utilizzare le reti bayesiane rispetto ad altri approcci di apprendimento automatico?


12

Mi aspetto che non ci possa essere una risposta definitiva a questa domanda. Ma in passato ho usato una serie di algoritmi di machine learning e sto cercando di conoscere le reti bayesiane. Vorrei capire in quali circostanze o per quali tipi di problemi sceglieresti di utilizzare la rete bayesiana rispetto ad altri approcci?


3
Per me le reti bayesiane sono un modo per definire le indipendenze condizionali in un modello. Dopo averlo definito, suppongo che tu possa utilizzare vari strumenti di apprendimento per stimare i parametri del modello. Quindi vedo una chiara separazione tra l'apprendimento dei parametri e il modello. Tuttavia, non sono un esperto in questo, quindi qualcuno può trovare una risposta migliore.
Luca

Risposte:


7

XYP(X,Y)P(Y|X)

L'apprendimento della distribuzione di probabilità congiunta (modello generativo) dei dati è più difficile dell'apprendimento della probabilità condizionale (modelli discriminativi). Tuttavia, il primo fornisce un modello più versatile in cui è possibile eseguire query come o , ecc. Con il modello discriminante, l'unico obiettivo è imparare .P ( X 1 | X 2 = A , X 3 = B ) P ( Y | X )P(X1|Y)P(X1|X2=A,X3=B)P(Y|X)

I BN utilizzano i DAG per prescrivere la distribuzione congiunta. Quindi sono modelli grafici.

vantaggi:

  1. Quando hai molti dati mancanti, ad esempio in medicina, i BN possono essere molto efficaci poiché modellare la distribuzione congiunta (ovvero la tua affermazione su come sono stati generati i dati) riduce la tua dipendenza nell'avere un set di dati pienamente osservato.

  2. causeeffect

  3. Imparare la distribuzione congiunta è un compito difficile, modellarlo per variabili discrete (attraverso il calcolo di tabelle di probabilità condizionali, cioè CPT) è sostanzialmente più semplice che provare a fare lo stesso per variabili continue. Quindi i BN sono praticamente più comuni con variabili discrete.

  4. I BN non solo consentono l'inferenza osservativa (come consentono tutti i modelli di apprendimento automatico) ma anche gli interventi causali . Questo è un vantaggio comunemente trascurato e sottovalutato di BN ed è correlato al ragionamento controfattuale.


1
Nel vantaggio 1 in cui si afferma che i BN sono efficaci per la modellazione di dati con molti valori mancanti, questi valori mancanti non influiscono sulla corretta identificazione delle indipendenze nei dati?
Hossein,

1
P(Y,X1,X2)X1X2

1

Nella mia esperienza, le reti bayesiane funzionano molto bene in presenza di dati categorici ad alta dimensione . Offrono modelli interpretabili, che (a volte) aiutano a dare un senso al modo in cui le diverse variabili interagiscono.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.