Una regressione è causale se non ci sono variabili omesse?


13

Una regressione di y su x non deve essere causale se ci sono variabili omesse che influenzano sia x che y . Ma se non per le variabili omesse e l'errore di misurazione, una regressione è causale? Cioè, se ogni possibile variabile è inclusa nella regressione?


4
No, anche se includessi ogni variabile nel mondo, potrebbe essere causale inversa. Ad esempio, la vicinanza di un pianeta alla sua stella più vicina potrebbe essere accuratamente prevista dalla temperatura superficiale del pianeta, ma chiaramente la causalità va dall'altra parte
gazza89,

@ gazza89 - dal momento che risponde efficacemente alla domanda, potresti volerlo espandere in una risposta.
jbowman,

3
Che cosa sono le "variabili omesse"? Supponiamo di avere una Y e 4 X nel mio set di dati. Mi adatto ad un modello che include tutte e 4 le X. Quindi non ho omesso le variabili?
user158565,

Risposte:


20

No, non lo è, ti mostrerò alcuni controesempi.

La prima è causalità inversa . Considera il modello causale è YX , dove X e Y sono variabili casuali gaussiane standard. Quindi E[Y|do(x)]=0 , poiché X non causa Y , ma E[Y|x] dipenderà da X .

Il secondo esempio è il controllo per i collider (vedi qui ). Considera il modello causale XZY , ovvero X non causa Y e Z è una causa comune. Ma nota che, se esegui una regressione che include Z , il coefficiente di regressione di X non sarà zero, perché il condizionamento sulla causa comune indurrà l'associazione tra Y e X (potresti voler vedere anche qui Analisi del percorso in presenza di un collider condizionato ).

Più in generale, la regressione di Y su X sarà causale se le variabili incluse nella regressione soddisfano il criterio backdoor .


3
Consiglio vivamente il libro del perché, di Judea Pearl. Spiega a cosa si riferisce Carlos.
Markos Kashiouris,

3
Cosa significa media? do(x)
naught101

5
@ naught101 significa che in realtà forzi X = x, contrariamente a osservare passivamente X = x, vedi qui stats.stackexchange.com/questions/211008/dox-operator-meaning/…
Carlos Cinelli

Grazie, ma non sono chiaro sulla notazione. Fa media Z fa sì che X e Y ? Le frecce devono essere invertite? XZYZXY
Esha,

@Esha Significa che sia che y causano zxyz
Carlos Cinelli,

6

Oltre all'importante risposta di Carlos Cinelli a questa domanda, ci sono alcune altre ragioni per cui i coefficienti di regressione potrebbero non essere causali.

XYXE(YX)=X2YXX2XY

In secondo luogo, e in relazione al tema della causalità inversa, c'è anche il rischio che tu possa avere un bias di selezione , cioè che il tuo campione sia stato selezionato in modo tale da non essere rappresentativo per la popolazione a cui desideri trarre la tua deduzione. Inoltre, i dati mancanti possono anche introdurre una distorsione se i dati non mancano completamente a caso.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.