Rappresentazione degli effetti di interazione nei grafici aciclici diretti


17

I grafici aciclici diretti (DAG; ad es. Groenlandia, et al, 1999) fanno parte di un formalismo di inferenza causale dall'interpretazione controfattuale del campo di causalità. In questi grafici la presenza di una freccia dalla variabile alla variabile afferma che la variabile provoca direttamente (qualche cambiamento nel rischio di) la variabile , e l'assenza di tale freccia afferma che la variabile non causa direttamente (qualche cambiamento nel rischio di) variabile .UNBUNBUNB

Ad esempio, l'affermazione "esposizione al fumo di tabacco provoca direttamente un cambiamento nel rischio di mesotelioma" è rappresentata dalla freccia nera da "esposizione al fumo di tabacco" a "mesotelioma" nel diagramma causale non un DAG di seguito.

Allo stesso modo, la frase "esposizione all'amianto provoca direttamente una variazione del rischio di mesotelioma" è rappresentata dalla freccia nera da "esposizione all'amianto" a "mesotelioma" nel grafico causale non un DAG di seguito.

Uso il termine non un DAG per descrivere il seguente grafico causale a causa della freccia rossa, che intendo affermare come "l'esposizione all'amianto provoca un cambiamento nell'effetto causale diretto dell'esposizione al fumo di tabacco sul rischio di mesotelioma" (l'amianto fa danno alle cellule del polmone che, oltre a causare direttamente un cambiamento nel rischio di mesotelioma, rende anche le cellule più sensibili ai danni cancerogeni dell'esposizione al fumo di tabacco con il risultato che l'esposizione sia all'amianto che al tabacco determina un aumento rischio che è superiore alla somma dei due rischi separati), e questo non si adatta perfettamente al significato formale delle frecce causali nei DAG che ho descritto all'inizio della mia domanda (ovvero perché la freccia rossa non termina in una variabile).

Non un grafico aciclico diretto: l'esposizione al fumo di tabacco provoca un aumento del rischio di mesotelioma;  l'esposizione all'amianto provoca un aumento del rischio di mesotelioma;  l'esposizione all'amianto provoca un aumento dell'effetto causale del tabacco sul rischio di mesotelioma.

In che modo si rappresentano correttamente gli effetti dell'interazione all'interno del formalismo visivo di un DAG?

Riferimenti

Groenlandia, S., Pearl, J. e Robins, JM (1999). Diagrammi causali per la ricerca epidemiologica . Epidemiologia , 10 (1): 37–48.


È possibile cambiare il DAG aggiungendo un nodo per danni alle cellule polmonari con le frecce del tabacco e dell'amianto puntate verso l'interno e una freccia verso il mesotelioma? Ciò mantiene il DAG e offre flessibilità per modellare gli effetti individuali e composti.
John Woolf,

Sì, avevo pensato a qualcosa del genere, ma mi chiedo se ciò implichi anche che l'effetto principale del tabacco non è anche il "danno alle cellule polmonari", quando lo è. Suppongo che si potrebbe aggiungere un'altra variabile "tabacco e amianto insieme" causata dal tabacco e dall'amianto, ma questo sembra goffo ... ma forse è quello che si deve fare.
Alexis,

Quale software hai usato per creare il grafico?
zipzapboing

@zipzapboing l'ha disegnato a mano in MS Word, o PageStream o Scribus o qualcosa del genere, quindi modificato per colori e trasparenza usando GIMP. (In realtà è un estratto di alcune delle mie diapositive della lezione.)
Alexis,

Risposte:


8

La teoria della causalità di Pearl è completamente non parametrica . Le interazioni non sono rese esplicite a causa di ciò, né nel grafico né nelle equazioni strutturali che rappresenta. Tuttavia, gli effetti causali possono variare (selvaggiamente) per ipotesi.

Se viene identificato un effetto e lo si stima dai dati in modo non parametrico, si ottiene una distribuzione completa degli effetti causali (anziché, per esempio, un singolo parametro). Di conseguenza, è possibile valutare in modo non parametrico l'effetto causale dell'esposizione al tabacco subordinatamente all'esposizione all'amianto per vedere se cambia, senza impegnarsi in alcuna forma funzionale.

Diamo un'occhiata alle equazioni strutturali nel tuo caso, che corrispondono al tuo "DAG" spogliato della freccia rossa:

f1εm

f2εt

f3εun'

ε

Abbiamo lasciato le rispettive funzioni f () e le distribuzioni degli errori non specificate, tranne per il fatto che queste ultime sono indipendenti. Tuttavia, possiamo applicare la teoria di Pearl e dichiarare immediatamente che vengono identificati gli effetti causali dell'esposizione al tabacco e all'amianto sul mesotelioma . Ciò significa che se avessimo infinitamente molte osservazioni da questo processo, potremmo misurare esattamente l'effetto dell'impostazione delle esposizioni a diversi livelli semplicemente vedendo l'incidenza del mesotelioma in individui con diversi livelli di esposizione. Quindi potremmo dedurre la causalità senza fare un vero esperimento. Questo perché non esistono percorsi back-door dalle variabili di esposizione alla variabile di risultato.

Quindi otterresti

P (mesotelioma | do (tabacco = t)) = P (mesotelioma | tabacco = t)

La stessa logica vale per l'effetto causale dell'amianto, che consente di valutare semplicemente:

P (mesotelioma | Tabacco = t, Amianto = a) - P (mesotelioma | Tabacco = t ', Amianto = a)

in confronto a

P (mesotelioma | Tabacco = t, Amianto = a ') - P (mesotelioma | Tabacco = t', Amianto = a ')

per tutti i valori rilevanti di te per valutare gli effetti dell'interazione.

Nel tuo esempio concreto, supponiamo che la variabile di risultato sia una variabile di Bernoulli - puoi avere o meno il mesotelioma - e che una persona è stata esposta a un livello molto elevato di amianto a. Quindi, è molto probabile che soffrirà di mesotelioma; di conseguenza, l'effetto dell'aumento dell'esposizione al tabacco sarà molto basso. D'altra parte, se i livelli di amianto a 'sono molto bassi, l'aumento dell'esposizione al tabacco avrà un effetto maggiore. Ciò costituirebbe un'interazione tra gli effetti del tabacco e dell'amianto.

Naturalmente, la stima non parametrica può essere estremamente impegnativa e rumorosa con dati finiti e molti valori t e a diversi, quindi potresti pensare di assumere una struttura in f (). Ma fondamentalmente puoi farlo senza quello.


Julian, grazie per l'approfondimento sulla logica causale contrafattuale di Pearl. La tua risposta sarebbe migliorata parlando della rappresentazione visiva degli effetti di interazione che era centrale per la mia domanda (forse dicendo "I DAG non rendono espliciti gli effetti di interazione", o cosa hai.)
Alexis,

1
Si hai ragione; Ho cercato di renderlo più chiaro all'inizio.
Julian Schuessler,

Julian, è grandioso. Dici che i blocchi costitutivi di un DAG non sono collegamenti individuali, C = f (D) ma più in generale insiemi di collegamenti, C = f (D, E, ...). Il mio problema è che Pearl a volte è vago su questo, ad esempio in "Causalità" la sua Def 2.2.1 .: "Una struttura causale di un insieme di variabili V è un DAG in cui ciascun nodo corrisponde a un elemento distinto di V, e ciascuno link rappresenta una relazione funzionale diretta tra le variabili corrispondenti. " Sicuramente i singoli collegamenti dai genitori di C a C non significano nulla da soli, mostrano solo la partecipazione a un'influenza collettiva su C. Sei d'accordo?
Steve Powell,

Sì. C = f (D, E) sarebbe mostrato da due collegamenti nel grafico da D / E a C. L'interpretazione dei collegamenti è che D ed E determinano C. Quindi i collegamenti, ovviamente, sono relazionali.
Julian Schuessler,

10

La semplice risposta è che lo fai già. I DAG convenzionali non rappresentano solo gli effetti principali, ma piuttosto la combinazione di effetti principali e interazioni. Una volta disegnato il DAG, si presuppone già che qualsiasi variabile che punta allo stesso risultato possa modificare l'effetto degli altri che puntano allo stesso risultato. È un presupposto modellistico, separato dal DAG, che presume la mancanza di un'interazione.

Inoltre, l'interazione può verificarsi senza includere un termine di interazione esplicito nel modello. Se si includono gli effetti principali solo in un modello per il rapporto di rischio di Y rispetto al trattamento T e alla covariata Q, la stima della differenza di rischio differirà a seconda del livello di Q. Al fine di soddisfare tutte queste possibilità in modo non parametrico, i DAG effettuano solo le ipotesi più deboli sulla forma funzionale delle relazioni tra le variabili, e supponendo che nessuna interazione sia un'ipotesi più forte che consentire un'interazione. Ciò significa ancora che i DAG consentono già l'interazione senza alcuna modifica. Vedi Vanderweele (2009) per una discussione sull'interazione che utilizza DAG convenzionali ma consente l'interazione.

Bollen & Paxton (1998) e Muthén & Asparouhov (2015) dimostrano entrambi interazioni in modelli di percorso con variabili latenti, ma queste interazioni si riferiscono esplicitamente ai termini del prodotto in un modello parametrico piuttosto che alle interazioni in senso lato. Ho anche visto diagrammi simili ai tuoi in cui la freccia causale punta a un tracciato, ma a rigor di termini un tracciato non è una quantità unica su cui una variabile può avere un effetto causale (anche se potrebbe essere così che vogliamo interpretare i nostri modelli) ; rappresenta semplicemente la presenza di un effetto causale, non la sua grandezza.


Bollen, KA e Paxton, P. (1998). Interazioni di variabili latenti nei modelli di equazioni strutturali. Modellazione di equazioni strutturali: un diario multidisciplinare, 5 (3), 267-293.

Muthén, B., & Asparouhov, T. (2015). Interazioni variabili latenti.

VanderWeele, TJ (2009). Sulla distinzione tra interazione e modifica dell'effetto. Epidemiologia, 20 (6), 863-871.


3
Inoltre: "Una volta che hai disegnato il tuo DAG, supponi già che qualsiasi variabile che punta allo stesso risultato possa modificare l'effetto degli altri che indicano lo stesso risultato. È un presupposto modellistico, separato dal DAG, che presume la mancanza di un'interazione ". è geniale ... ha davvero aiutato queste idee ad atterrare con me.
Alexis,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.