Credo che la rapida risposta di una frase alla tua domanda,
Quando è appropriato controllare la variabile Y e quando no?
è il "criterio backdoor".
Il Modello causale strutturale di Judea Pearl può dirti in modo definitivo quali variabili sono sufficienti (e quando è necessario) per il condizionamento, per inferire l'impatto causale di una variabile su un'altra. Vale a dire, si risponde a questo con il criterio back-door, che è descritto nella pagina 19 di questo Pearl dalla documento.
L'avvertenza principale è che richiede di conoscere la relazione causale tra le variabili (sotto forma di frecce direzionali in un grafico). Non c'è modo di aggirare questo. È qui che possono entrare in gioco la difficoltà e la possibile soggettività. Il modello causale strutturale di Pearl ti consente solo di sapere come rispondere alle domande giuste dato un modello causale (cioè un grafico diretto), quale serie di modelli causali è possibile data una distribuzione di dati o come cercare la struttura causale eseguendo il giusto esperimento. Non ti dice come trovare la giusta struttura causale data solo la distribuzione dei dati. In realtà, afferma che ciò è impossibile senza usare la conoscenza / intuizione esterna sul significato delle variabili.
I criteri backdoor possono essere dichiarati come segue:
Per trovare l'impatto causale di su Y , un insieme di nodi variabili SXY,S è sufficiente condizionare purché soddisfi entrambi i seguenti criteri:
1) Nessun elemento in è un discendente di XSX
2) blocca tutti i percorsi "back-door" tra X e YSXY
Qui, un percorso "back-door" è semplicemente un percorso di frecce che iniziano a e terminano con una freccia che punta a X . (La direzione che tutte le altre frecce indicano non è importante.) E il "blocco" è, di per sé, un criterio che ha un significato specifico, che è dato nella pagina 11 del link sopra. Questo è lo stesso criterio che leggeresti quando imparerai a conoscere la "separazione D". Ho trovato personalmente quel capitolo 8 di Bishop's Pattern Recognition and Machine LearningYX. descrive il concetto di blocco nella separazione D molto meglio della fonte di Pearl che ho collegato sopra. Ma va così:
Un insieme di nodi, blocca un percorso tra X e Y se soddisfa almeno uno dei seguenti criteri:S,XY
1) Uno dei nodi nel percorso, che è anche in emette almeno una freccia sul percorso (ovvero la freccia punta lontano dal nodo)S,
2) Un nodo che non è né in né un antenato di un nodo in SSS ha due frecce nel percorso "che si scontrano" verso di esso (cioè incontrandolo testa a testa)
Questo è un criterio o , diversamente dal criterio generale back-door che è un e il criterio.
Per essere chiari sul criterio back-door, ciò che ti dice è che, per un dato modello causale, quando ti condizioni su una variabile sufficiente, puoi imparare l'impatto causale dalla distribuzione di probabilità dei dati. (Come sappiamo, la distribuzione congiunta da sola non è sufficiente per trovare un comportamento causale perché più strutture causali possono essere responsabili della stessa distribuzione. Ecco perché è richiesto anche il modello causale.) La distribuzione può essere stimata utilizzando statistiche ordinarie / metodi di apprendimento automatico sui dati osservativi. Quindi, per quanto ne sai che la struttura causale consente il condizionamento su una variabile (o insieme di variabili), la tua stima dell'impatto causale di una variabile su un'altra è buona quanto la tua stima della distribuzione dei dati, che ottieni attraverso metodi statistici.
Ecco cosa troviamo quando applichiamo il criterio back-door ai tuoi due diagrammi:
In nessun caso non esiste un percorso back-door da a X . Quindi è vero che Y blocca "tutti" i percorsi back-door, perché non ce ne sono. Tuttavia, nel diagramma di sinistra, Y è un discendente diretto di X , mentre nel diagramma di destra non lo è. Pertanto Y segue il criterio backdoor nel diagramma a destra, ma non a sinistra. Questi sono risultati non sorprendenti.ZX.YYX,Y
Ciò che è sorprendente, tuttavia, è che nello schema a destra, fino a quando è il quadro completo, non è necessario condizione su per ottenere l'effetto causale pieno di X su Z . (Detto in altro modo, l' insieme null soddisfa i criteri back-door ed è quindi sufficiente per il condizionamento.) Intuitivamente questo è vero perché il valore di X non è associato a quello di Y, quindi per dati sufficienti puoi semplicemente fare una media sul valori di Y per marginalizzare l'effetto di Y su Z . Un'obiezione a questo punto può essere che i dati sono limitati, quindi non hai una distribuzione rappresentativa diYXZXYYYZ.Valori Y. Ma ricorda che il criterio back-door presuppone che tu abbia la distribuzione probabilistica dei dati. In questo caso si può analiticamente marginalizzare Y . La marginalizzazione su un set di dati finito è solo una stima. Inoltre, nota che èaltamenteimprobabile che questa sia l'immagine completa. Ci sono probabilmente i fattori esterni che hanno un impatto X . Se anche questi fattori sono associati a Y in qualche modo, allora si deve fare più lavoro per vedere se Y deve essere condizionato o se è persino sufficiente. Se si disegna un'altra freccia che punta da Y a X, allora Y diventa necessario per il controllo.YY.X.YYYXY
Questi sono, ovviamente, esempi molto semplici in cui l'intuizione è sufficiente per sapere quando può o non può essere controllato. Ma ecco un altro paio di esempi in cui non è ovvio guardando il diagramma e puoi usare i criteri back-door. Per il seguente schema si chiede se è sufficiente a controllare per Y nel determinare l'impatto causale di X su Z .YYXZ.
La prima cosa da notare è che, in entrambi i casi, non è un discendente di X . Quindi passa questo criterio. La prossima cosa da notare è che, in entrambi i casi, ci sono diversi percorsi di backdoor da Z a X . Due nel diagramma a sinistra e tre a destra.YX.ZX.
Z←Y→XZ←W→B←A→X. blocca il primo percorso perché è un nodo che emette frecce che si trova direttamente nel percorso. Y bloccaancheil secondo percorso perché non è né B , né è un discendente di B , che è l'unica freccia che si scontra con il nodo nel percorso. Pertanto Y è un set sufficiente per il condizionamento. (Nota, diversamentevostrodiagramma destra, l'insieme vuoto non è sufficiente per il condizionamento, perché non blocca il percorso Z ← Y → X ).YY B,B,YZ←Y→X
Nel diagramma di destra i percorsi backdoor sono gli stessi due come nella sinistra, oltre il percorso Z←W→B→Y→X. fabloccare questo percorso, perché è una freccia che emette nodo nel percorso. Blocca anche il percorso Z ← Y → X per lo stesso motivo del diagramma di sinistra. Esso tuttavianonbloccare il percorso Z ← W → B ← A → X , perché è un discendente diretto del nodo collider B . Quindi ènonsufficiente per il condizionamento.Y Z←Y→XZ←W→B←A→X,B.
YAWXZB.XZB,BAW, non sarebbe un problema perché non ha alcun impatto sulle variabili importanti o sulle variabili esogene che le determinano. Tuttavia, se (o uno qualsiasi dei suoi discendenti) è controllato, allora rende effettivamente A e W dipendenti, il che crea la relazione spuria tra X e Z che non vogliamo. Come menzionato nella fonte collegata, questo è un esempio del paradosso di Berkson , in cui l'osservazione di una variabile causata da due fonti indipendenti rende tali fonti dipendenti (ad es. Il risultato di due lanci di monete indipendenti viene reso dipendente dall'osservazione del numero del totale capovolto).BAWXZ
Come ho detto prima, l'uso del criterio back-door richiede che tu conosca il modello causale (cioè il diagramma "corretto" delle frecce tra le variabili). Ma il Modello causale strutturale, secondo me, offre anche il modo migliore e più formale di cercare un tale modello o di sapere quando la ricerca è futile. Ha anche il meraviglioso effetto collaterale di rendere obsoleti termini come "confusione", "mediazione" e "spurie" (che mi confondono). Fammi vedere l'immagine e ti dirò quali cerchi dovrebbero essere controllati.