La direzione dei bordi in una rete Bayes è irrilevante?


10

Oggi, in una lezione, è stato affermato che la direzione dei bordi in una rete Bayes non ha molta importanza. Non devono rappresentare la causalità.

È ovvio che non è possibile cambiare un singolo fronte in una rete Bayes. Ad esempio, lascia con ed . Se a , non sarebbe più aciclico e quindi non una rete Bayes. Questo sembra essere principalmente un problema pratico su come stimare le probabilità allora. Questo caso sembra essere molto più difficile a cui rispondere, quindi lo salterò.G=(V,E)V={v1,v2,v3}E={(v1,v2),(v1,v3),(v2,v3)}(v1,v3)(v3,v1)G

Questo mi ha fatto porre le seguenti domande per le quali spero di ottenere risposte qui:

  1. È possibile per qualsiasi grafico aciclico diretto (DAG) invertire tutti i bordi e avere ancora un DAG?
  2. Supponiamo che un DAG e i dati siano forniti. Ora costruiamo il DAG inverso . Per entrambi i DAG, adattiamo i dati alle reti Bayes corrispondenti. Ora abbiamo una serie di dati per i quali vogliamo utilizzare la rete Bayes per prevedere gli attributi mancanti. Potrebbero esserci risultati diversi per entrambi i DAG? (Bonus se ti viene in mente un esempio)GGinv
  3. Simile a 2, ma più semplice: supponiamo che un DAG e i dati siano dati. Puoi creare un nuovo grafico invertendo qualsiasi insieme di spigoli, purché rimanga aciclico. Le reti Bayes sono equivalenti quando si tratta delle loro previsioni?GGG
  4. Otteniamo qualcosa se abbiamo bordi che rappresentano la causalità?

Risposte:


6

TL; DR: a volte è possibile creare una rete bayesiana equivalente invertendo le frecce, a volte non è possibile.

Il semplice invertire la direzione delle frecce produce un altro grafico diretto, ma quel grafico non è necessariamente il grafico di una rete bayesiana equivalente, perché le relazioni di dipendenza rappresentate dal grafico a freccia invertita possono essere diverse da quelle rappresentate dal grafico originale. Se il grafico a freccia rovesciata rappresenta relazioni di dipendenza diverse rispetto all'originale, in alcuni casi è possibile creare una rete bayesiana equivalente aggiungendo altre frecce per acquisire relazioni di dipendenza mancanti nel grafico a freccia rovesciata. Ma in alcuni casi non esiste una rete bayesiana esattamente equivalente. Se devi aggiungere alcune frecce per acquisire dipendenze,

Ad esempio, a -> b -> crappresenta le stesse dipendenze e indipendenze di a <- b <- c, e le stesse di a <- b -> c, ma non le stesse di a -> b <- c. Questo ultimo grafico dice che ae csono indipendenti, se bnon viene rispettata, ma a <- b -> cdice ae cdipendono in quel caso. Possiamo aggiungere un bordo direttamente aa ccatturare, ma poi ae cdi essere indipendente quando bsi osserva non è rappresentato. Ciò significa che esiste almeno una fattorizzazione che non possiamo sfruttare quando calcoliamo le probabilità posteriori.

Tutta questa roba su dipendenza / indipendenza, frecce e loro inversioni, ecc., È trattata in testi standard su reti bayesiane. Posso estrarre alcuni riferimenti se vuoi.

Le reti bayesiane non esprimono causalità. Judea Pearl, che ha lavorato molto sulle reti bayesiane, ha anche lavorato su quelle che chiama reti causali (essenzialmente reti bayesiane annotate con relazioni causali).


Questo risponde alle domande (2) e (3). Hai un'idea anche delle domande (1) e (4)? (Sì, i riferimenti sarebbero carini)
Martin Thoma

(1) Considerare il contrappeso: se il grafico a freccia rovesciata ha un ciclo diretto, seguire le frecce attorno al ciclo all'indietro deve essere un ciclo diretto nel grafico originale. (4) Le reti bayesiane sono modelli probabilistici e come tali non rappresentano la causalità. È possibile che alcune frecce si riferiscano effettivamente alle relazioni causali, ma ciò si perde in un modello probabilistico. Forse acause b, ma a -> be a <- bsono ugualmente validi modelli probabilistici.
Robert Dodier,

Alcuni riferimenti introduttivi. Koller & Friedman: "Modelli grafici probabilistici". Cowell, Dawid, Lauritzen e Spiegelhalter: "Reti probabilistiche e sistemi esperti". Castillo, Gutierrez e Hadi: "Sistemi esperti e modelli di reti probabilistiche".
Robert Dodier,

È possibile invertire qualsiasi freccia e ottenere una rete bayesiana equivalente purché si mantengano le strutture a V (non invertire una freccia che un'altra freccia punta anche al nodo a cui punta)
borgr

1

Questo potrebbe essere un po 'insoddisfacente, quindi sentiti libero di non accettare questa risposta e scusa in anticipo.

In una rete di Bayes, i nodi rappresentano variabili casuali e i bordi rappresentano dipendenze condizionali. Quando si interpretano i nodi in un certo modo, il condizionamento scorre in un certo modo in modo naturale. Invertirli arbitrariamente non ha davvero senso nel contesto della modellazione dei dati. E molto tempo, le frecce rappresentano la causalità.


1
Questo è abbastanza lontano dal segno. L'interpretazione "naturale" è qualcosa di imposto al modello, non fa parte del modello stesso. È possibile invertire le dipendenze (aggiungendo ulteriori bordi se necessario per preservare l'insieme di dipendenze rappresentato dalla rete) ed è ancora una rete bayesiana. Se ha senso non è possibile rispondere esaminando solo la rete stessa. Per inciso, Judea Pearl, uno dei maggiori promotori delle reti bayesiane negli anni '80 e '90, ha lavorato più recentemente a modelli formali per la causalità, che esprimono relazioni causali nel modello.
Robert Dodier,

Dici "se ha senso non è possibile rispondere esaminando solo la rete stessa". Non ho mai detto di si. Ho detto "quando interpretate i nodi in un certo modo, il condizionamento scorre in un certo modo ..." Questo probabilmente riflette il mio pregiudizio; puoi chiamare le cose che lavoro su una rete bayes, ma questa domanda non verrebbe mai per me. Ad esempio, se due nodi rappresentano la stessa variabile in momenti diversi, non ci sarebbe dubbio su quale direzione scorre il condizionamento. Accetto tuttavia la possibilità che ci siano situazioni in cui le persone potrebbero usare queste reti di Baye in modo meno rigido.
Taylor,

0

Domanda 3

synergy.st-andrews.ac.uk/vannesmithlab afferma che i grafici

G1 = o->o->o and
G2 = o<-o->o

sono in una classe di equivalenza. Secondo tale fonte, i modelli rappresentano esattamente la stessa distribuzione di probabilità congiunta.


Non può essere giusto. Per G1, il primo e l'ultimo dipendono dall'assenza di valori noti. Per G2, il primo e l'ultimo non dipendono dall'assenza di valori noti. Volevi scrivere G2 = o <- o -> oinvece? Comunque non vedo un reclamo su quei particolari grafici sulla pagina web a cui hai fatto riferimento; forse puoi essere più specifico.
Robert Dodier,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.