Come rappresentare correttamente le variabili di differenza nei DAG?


8

Se sono interessato agli effetti causali della variazione di una variabile ( ) su un risultato ( ), come lo rappresenterei in un grafico aciclico diretto (DAG)?EO

Supponiamo che , dove ed verificano a volte 1 e 2, un DAG corretto sia: ΔE2=E2-E1E1E2

1. Supponendo che è semplicemente catturato da tutti i livelli di e (alla gli effetti di interazione stesso modo sono così catturati)? ΔE2E1E2



2. Supponendo che sia una variabile causalmente distinta da ed , ma che richieda la presenza di tali variabili? ΔE2E1E2



3. Supponendo che sia indipendente da ed E_2 e che quest'ultimo non sia necessario per rappresentare gli effetti di \ Delta E_2 ? ΔE2E1E2ΔE2


  1. Qualcos'altro?

NOTA: " DAG " non significa "qualsiasi vecchio tipo di grafico causale o correlativo", ma è un formalismo strettamente proibito che rappresenta credenze causali.


La mia motivazione è che sto cercando di pensare alla rappresentazione DAG di modelli dinamici come il modello di correzione degli errori generalizzata:

ΔOt=β0+βc(Ot-1-Et-1)+βΔEΔEt+βEEt-1+εt

Naturalmente, la stima dei parametri grezzi viene trasformata per interpretare il modello come di seguito, quindi forse DAGing il modello sopra sarebbe ancora più disordinato?

Effetto istantaneo a breve termine del cambiamento in su :EΔOβΔE

Effetto ritardato a breve termine del livello di su :EΔOβEβcβΔE

Effetto di equilibrio a lungo termine di ritardato su :EΔOβcβEβc

Risposte:


4

La soluzione è pensare in modo funzionale.

Il valore di ΔE2=f(E1,E2) più specificamenteΔE2=E2-E1. Pertanto le variabili di differenza possono essere rappresentate nei DAG con l'opzione 4, "qualcos'altro" (presuppone questo DAGE1 e E2 causa diretta O oltre alla loro differenza):

Se E1 & E2 non hanno effetti diretti su O, ΔE2 rimane ancora una funzione dei suoi genitori:

Se riscriviamo così il modello di correzione dell'errore generalizzata a singolo ritardo (Qt-1 per "termine eQuilibrium", dove Qt-1=Ot-1-Et-1):

ΔOt=β0+βc(Qt-1)+βΔEΔEt+βEEt-1+εt

Quindi il DAG alla base del modello per ΔOt (ignorando i suoi discendenti a t+1) è:

Gli effetti di E su ΔOt dal modello si entra quindi dal termine di equilibrio Qt-1, a partire dal Et-1 e dal termine del cambiamento ΔEt. Altre cause diOt-1, Ot, Et-1 e Et (ad es. variabili non modellate, input casuali) sono lasciati impliciti.

La parte di questa risposta corrispondente ai primi due DAG è fornita per gentile concessione della comunicazione personale con Miguel Hernán.


1

MODIFICARE:

Se ti preoccupi solo di rappresentare relazioni non parametriche tra le tue variabili, penso che 1) sarebbe il più appropriato. Mentre può esserci una forma funzionale più specifica che collega le due variabili al risultato, in un DAG non è necessario rappresentare quella forma. D'altra parte, se si desidera utilizzare un diagramma di percorso che rappresenta un modello di equazione strutturale lineare come quello che è stato scritto, sarebbe opportuno includere il punteggio di differenza nel diagramma; in questo modo, il modello specifico che hai scritto e il diagramma sarebbero ugualmente specifici. Un DAG è più vago (ma anche più flessibile) poiché non richiede (o è necessario consentire) un modulo di funzione specifico.

Potrebbe arrivare all'obiettivo di disegnare il tuo DAG. Se il tuo obiettivo è rappresentare con la massima precisione possibile le relazioni tra le tue variabili, sarebbe logico includere il termine differenza come propria variabile poiché ha una propria forza causale. Anche un grafico senza di esso sarebbe valido. In teoria, si potrebbero fare le stesse dichiarazioni di indipendenza condizionale sull'esito e sui predittori con un DAG più dettagliato che con uno meno dettagliato.


La mia intuizione è la più vicina a 3). Se è vero quelloE1 e E2 non influenzano direttamente O tranne che per la loro differenza, quindi 3) è corretto e aggiungerei bordi da E1 e E2 per ΔE2 e da E1 per E2per completezza. Nessun altro nodo indicherebbe la variabile differenza, ma invece le variabili che prevedono la differenzaE1 e / o E2. Graficamente, quello che sto descrivendo è:

E1
 |---->  E2-E1 ---> O
 V       ^
E2-------|

con possibili frecce aggiuntive da E1 e E2 per O se influenzano O oltre il loro effetto attraverso la loro differenza.


"Se è vero che E1 ed E2 non influenzano direttamente O se non per la loro differenza", sembra che tu stia ignorando il modello che ho specificato.
Alexis,

Seconda preoccupazione. La variabile di interazioneE1×E2 è puramente una funzione di E1 e E2, Tuttavia, una tale variabile non sarebbe rappresentato come avete disegnato il DAG nella sua risposta , quindi non è affatto chiaro per me che, anche se io fossi interessato a modelloΔO=β0+ΔE2+εche il tuo DAG sarebbe corretto.
Alexis,

Quelle sono buone preoccupazioni. Stavo ignorando il modello che hai specificato e mi sono concentrato sulla tua domanda. Vuoi specificare un diagramma di percorso che rappresenti un modello di equazione strutturale lineare o un DAG non parametrico? Se il primo, ti consigliamo di includere il termine differenza come propria variabile. Altrimenti, come hai detto, sarebbe opportuno non farlo (proprio come sarebbe con un'interazione). Revisionerò la mia risposta.
Noah,

La domanda non ha nulla a che fare con i SEM. Si può dire perché SEM non appare nella domanda, anche come tag. :) D'altra parte, la mia domanda riguarda i DAG. :) Inoltre: per quanto riguarda il mio secondo commento "per niente chiaro" non significa che non sei corretto ... significa solo che ho bisogno di persuadere sui formalismi DAG.
Alexis,

1
La mia risposta probabilmente non è molto convincente, ma spero che qualcun altro possa fare un lavoro migliore. Il modello che hai scritto è un SEM lineare, quindi anche se non lo hai chiesto espressamente, se stai cercando di mettere in relazione una sorta di diagramma del percorso con i termini in un modello, ti stai avventurando nel territorio del diagramma del percorso SEM.
Noah,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.