Quali sono le tecniche empiriche per mostrare la causalità?


12

Una semplice regressione lineare mostra solo la correlazione tra due variabili. Per stabilire la causalità, due metodi comunemente insegnati sono la regressione IV e gli esperimenti naturali. Quali sono gli altri metodi che le persone usano per stabilire la causalità?


2
È contestato se la regressione IV dice molto sulla causalità
EnergyNumbers,

Risposte:


15

Gli esperimenti naturali sono di solito un'impostazione per l'inferenza causale piuttosto che uno strumento di inferenza causale in sé. Spesso devi impiegare qualcosa come la differenza nella differenza o le variabili strumentali, anche quando hai un esperimento naturale.

Ecco un elenco di approcci statistici di inferenza causale (Approccio: descrizione laica)

  • Variabili strumentali : la variabile X assegnata casualmente influenza Z solo attraverso Y
  • Differenza nelle differenze : se due gruppi hanno una tendenza comune e viene trattato solo un gruppo, la variazione della differenza tra i gruppi è l'effetto del trattamento
  • Discontinuità di regressione : se una soglia rigida determina il trattamento, osserva la differenza proprio attorno a tale soglia
  • Corrispondenza del punteggio di propensione : creare un gruppo di controllo abbinando le osservazioni non trattate che probabilmente sarebbero state trattate (ma in realtà non trattate) con le osservazioni trattate con una probabilità simile di trattamento.
  • Manhalobis matching a distanza : crea un gruppo di controllo abbinando osservazioni non trattate che sembrano simili a quelle trattate. Un'altra misura di distanza notevole è la corrispondenza esatta grossolana .
  • Controllo sintetico : quando hai una sola osservazione trattata, crea un composto di osservazioni non trattate che individualmente sono controlli imperfetti ma che agiscono collettivamente come un buon controllo.
  • Coorti sintetiche - Tratta le osservazioni ripetute di gruppi come un gruppo di individui e impiega tecniche di gruppo.
  • Modellazione del bias di selezione come la correzione di Heckman : supponi una forma parametrica per il bias di selezione e rimuovila, in modo che i risultati di regressione corretti possano essere interpretati in modo causale.
  • Ponderazione del campione in senso più ampio : correggere i bias risultanti dalla partecipazione endogena e dall'eterogeneità non modellata ponderando le unità del campione in modo che assomiglino più alla vera popolazione di interesse.

Per un elenco di metodi puoi dare un'occhiata al nostro ReplicationWiki. Gli studi che li usano sono elencati e puoi cercare quali di essi hanno dati e codice disponibili, come qui per la differenza nelle differenze .
Jan Höffler,

1

La differenza in Differenza è probabilmente il metodo preferito in econometria (sebbene richieda il bootstraping, ovvero la correzione dei dati dall'auto-correlazione). Paragona sostanzialmente l'evoluzione di due gruppi, da un punto in cui nessuno è soggetto al fattore dato ad un punto in cui uno di essi è soggetto al fattore. Un esempio famoso è l' uso del metodo da parte di Card e Krueger per studiare l'impatto di un salario minimo.


Se qualcuno sa come posso ridimensionare quell'immagine, sentiti libero di modificare;)
VicAche,

Usa semplicemente il codice immagine HTML standard: (ad es. <Img src = "URL" larghezza = "100" height = "100">)
BKay

1
La differenza nella differenza non stabilisce la causalità. Stabilisce la possibile dimensione di un effetto; ma non la causalità.
EnergyNumbers,

La quantificazione degli effetti sta stimando la causalità, almeno come la comprende OP.
VicAche,

1

La progettazione della discontinuità della regressione, così come la differenza nelle differenze è un metodo per sfruttare gli esperimenti naturali. Si basa su regole arbitrarie che danno "trattamenti" diversi a unità altrimenti simili.

Un esempio da Wikipedia:

Se a tutti gli studenti al di sopra di un determinato voto - ad esempio l'80% - viene assegnata la borsa di studio, è possibile ottenere l'effetto del trattamento locale confrontando gli studenti con il limite dell'80%: l'intuizione qui è che uno studente che ottiene un punteggio del 79% è probabile per essere molto simile a uno studente con un punteggio dell'81% - dato la soglia predefinita dell'80%, tuttavia, uno studente riceverà la borsa di studio, mentre l'altro no. Il confronto tra il risultato del vincitore (gruppo di trattamento) e il risultato controfattuale del non destinatario (gruppo di controllo) fornirà quindi l'effetto del trattamento locale.


1

Per seguire il commento di @EnergyNumbers, la causalità scaturisce dalla tua teoria .

Una distinzione chiave è questa: la matematica in uno qualsiasi dei metodi nella risposta di @ BKay è progettata per sputare i numeri alla fine della procedura. Ad esempio, considera un diff-in-diff in cui il tuo trattamento è qualcosa di sciocco come essere leccato in faccia da un cane. Puoi sempre impostare un diff-in-diff per vedere se essere leccato in faccia dai cani fa sì che le persone diventino astronauti.

La stupidità a parte, pensare alla causalità da zero può essere molto utile - per includere la scelta della procedura. I seminari di economia ruotano spesso intorno alla fattibilità della teoria e alla validità delle ipotesi.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.