Quali teorie di causalità dovrei sapere?


16

Quali approcci teorici alla causalità dovrei conoscere come statistico / econometrico applicato?

Conosco il (un pochino)

Quali concetti mi mancano o dovrei conoscere?

Correlati: quali teorie sono le basi della causalità nell'apprendimento automatico?

Ho letto queste domande interessanti e le risposte ( 1 , 2 , 3 ) ma penso che sia una domanda diversa. E sono stato molto sorpreso di vedere che la "causalità", per esempio, non è menzionata in Elements of Statistical Learning .


2
Dai un'occhiata alla recensione di Andrew Gelman di diversi lavori sulla causalità in AJS: Gelman, A. (2011). Causalità e apprendimento statistico. American Journal of Sociology, 117 (3), 955-966. doi: 10.1086 / 662659 . È una breve panoramica della causalità nella scienza sociale con riferimenti specifici alle opere di Rubin e Pearl, così come alcune altre. Un buon posto per setacciare i riferimenti.
paqmo,

1
Per cominciare, i metodi di (John Stuart) Mill. it.wikipedia.org/wiki/Mill's_Methods
noumenal

Vedi il mio commento sotto la risposta accettata per quanto riguarda la possibile interpretazione errata della causalità di Granger lì.
Richard Hardy,

Risposte:


17

B

Mentre è quasi indiscutibile che una causa debba precedere il suo effetto nel tempo, per trarre conclusioni causali con la precedenza nel tempo è ancora necessario rivendicare l'assenza di confusione, tra le altre fonti di associazioni spurie.

Ora per quanto riguarda i risultati potenziali (Neyman-Rubin) contro i grafici causali / Modellazione di equazioni strutturali (Perla), direi che questo è un falso dilemma e dovresti imparare entrambi.

Innanzitutto, è importante notare che queste non sono opinioni opposte sulla causalità . Come dice Pearl, esiste una gerarchia relativa alle attività di inferenza (causale):

  1. Predizione osservativa
  2. Previsione sotto intervento
  3. controfattuali

Per la prima attività è sufficiente conoscere la distribuzione congiunta delle variabili osservate. Per il secondo compito è necessario conoscere la distribuzione congiunta e la struttura causale. Per l'ultimo compito, dei controfattuali, avrai bisogno di alcune informazioni sulle forme funzionali del tuo modello di equazione strutturale.

Quindi, quando si parla di controfattuali, esiste un'equivalenza formale tra le due prospettive . La differenza è che i risultati potenziali prendono dichiarazioni controfattuali come primitivi e nei controfattuali DAG sembrano essere derivati dalle equazioni strutturali. Tuttavia, potresti chiedere, se sono "equivalenti", perché preoccuparsi di imparare entrambi? Perché ci sono differenze in termini di "facilità" per esprimere e derivare le cose.

Ad esempio, prova ad esprimere il concetto di M-Bias usando solo i risultati potenziali --- non ne ho mai visto uno buono. In effetti, la mia esperienza finora è che i ricercatori che non hanno mai studiato i grafici non ne sono nemmeno consapevoli. Inoltre, trasmettere le ipotesi sostanziali del tuo modello in linguaggio grafico renderà più semplice dal punto di vista computazionale derivarne le implicazioni empiriche verificabili e rispondere a domande di identificabilità. D'altra parte, a volte le persone troveranno più facile pensare prima direttamente ai controfattuali stessi e combinarlo con ipotesi parametriche per rispondere a domande molto specifiche.

C'è molto di più che si possa dire, ma il punto qui è che dovresti imparare a "parlare entrambe le lingue". Per riferimenti, puoi vedere come iniziare qui.


1
Potresti fornire un esempio di qualcosa che è facile da esprimere in termini di OP, ma non nei DAG?
Guilherme Duarte,

@GuilhermeDuarte: quantità di mediazione che coinvolgono controfattuali nidificati, ad esempio
Carlos Cinelli,

3
Penso che la tua visione della causalità di Granger (almeno come esposta qui) sia un po 'imprecisa. Causalità di GrangerUNsolrun'ngerB significa che UNha aggiunto potere predittivo quando la storia diB stesso viene utilizzato per la previsione B. Pertanto i galli non causano l'alba perché Granger non migliorano sulla previsione dell'alba in base ai dati storici sulle albe.
Richard Hardy,

@RichardHardy Penso che tu abbia ragione, forse un gallo perfetto che canta sempre un'ora prima dell'alba potrebbe avere un potere predittivo oltre un modello lineare di serie temporali dell'alba (poiché l'alba non è esattamente la stessa ogni giorno), ma con un modello perfetto probabilmente non aggiunge nulla.
Carlos Cinelli,

Penso che la causalità di Granger non suggerisca di usare modelli predittivi inferiori con solo la storia di B per giustificare la necessità di una variabile aggiuntiva A e quindi la causalità di Granger. Piuttosto, si dovrebbe idealmente mirare a un modello quanto più buono possibile usando la propria storia di B e quindi vedere se l'aggiunta di A (in qualche forma) aiuta a prevedere B. E, naturalmente, "un gallo perfetto" è un concetto piuttosto utopico. Detto questo, penso che modificare la risposta per riflettere ciò potrebbe essere una buona idea.
Richard Hardy,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.