Che cos'è la differenza nelle differenze?


43

La differenza nelle differenze è stata a lungo popolare come strumento non sperimentale, specialmente in economia. Qualcuno può fornire una risposta chiara e non tecnica alle seguenti domande sulle differenze nelle differenze.

Che cos'è uno stimatore della differenza in differenza?
Perché è utile uno stimatore della differenza in differenza?
Possiamo davvero fidarci delle stime della differenza in differenza?


Qualcuno sa come stimare una differenza nella regressione della differenza in gretl? Devo lavorare con i dati OLS o del pannello?

3
@Pyca Sembra un uso inappropriato dei commenti lì. Dovresti pubblicare una nuova domanda, con riferimento a questa.
chl

Risposte:


66

Qual è la differenza nello stimatore delle
differenze La differenza nelle differenze (DiD) è uno strumento per stimare gli effetti del trattamento confrontando le differenze pre e post trattamento nel risultato di un trattamento e di un gruppo di controllo. In generale, siamo interessati a stimare l'effetto di un trattamento (ad es. Stato sindacale, farmaci, ecc.) Su un risultato Y i (es. Salari, salute, ecc.) Come in Y i t = α i + λ t + ρ D i t + X i t β + ϵ i t dove αDiYi

Yit=αi+λt+ρDit+Xitβ+ϵit
sono individuali effetti fissi (caratteristiche degli individui che non cambiano nel corso del tempo), λ t sono il tempo effetti fissi, X i t sono covariate variabili nel tempo come l'età degli individui, e ε i t è un termine di errore. Gli individui e il tempo sono indicizzati rispettivamente da i e t . Se esiste una correlazione tra gli effetti fissi e D i t, la stima di questa regressione tramite OLS sarà distorta dato che gli effetti fissi non sono controllati per. Questa è la tipicadistorsione da variabile omessa.αiλtXitϵititDit

t=1,2s=A,B

ρ=(E[Yist|s=A,t=2]E[Yist|s=A,t=1])(E[Yist|s=B,t=2]E[Yist|s=B,t=1])

Graficamente questo sarebbe simile a questo: inserisci qui la descrizione dell'immagine

AB

  • controllare per le covariate
  • per ottenere errori standard per l'effetto del trattamento per vedere se è significativo

treatiAtimett=2

Yit=β1+β2(treati)+β3(timet)+ρ(treatitimet)+ϵit

Tit

Yit=β1γs+β2λt+ρTit+ϵit

γsλt


E(Y0it|i,t)=αi+λtE(Y0it|s,t)=γs+λts

Possiamo fidarci della differenza nelle differenze?
Il presupposto più importante in DiD è il presupposto delle tendenze parallele (vedere la figura sopra). Non fidarti mai di uno studio che non mostra graficamente queste tendenze! Gli articoli negli anni '90 potrebbero essersene andati bene, ma oggigiorno la nostra comprensione di DiD è molto meglio. Se non esiste un grafico convincente che mostri le tendenze parallele nei risultati pre-trattamento per i gruppi di trattamento e controllo, sii prudente. Se il presupposto delle tendenze parallele è valido e possiamo escludere in modo credibile qualsiasi altra variazione nel tempo che possa confondere il trattamento, allora DiD è un metodo affidabile.

Un'altra parola di cautela dovrebbe essere applicata quando si tratta del trattamento degli errori standard. Con molti anni di dati è necessario regolare gli errori standard per l'autocorrelazione. In passato, questo è stato trascurato, ma da quando Bertrand et al. (2004) "Quanto dovremmo fidarci delle stime delle differenze nelle differenze?" sappiamo che questo è un problema. Nel documento forniscono diversi rimedi per gestire l'autocorrelazione. Il più semplice è raggruppare l'identificatore del singolo pannello che consente una correlazione arbitraria dei residui tra le singole serie temporali. Ciò corregge sia l'autocorrelazione che l'eteroscedasticità.

Per ulteriori riferimenti vedere queste note di conferenza di Waldinger e Pischke .



0

È una tecnica ampiamente utilizzata in econometria per esaminare l'influenza di qualsiasi evento esogeno in una serie temporale. Scegli due gruppi separati di dati relativi a prima e dopo l'evento studiato. Un buon riferimento per saperne di più è il libro Introduzione all'econometria di Wooldridge.


2
Essendo una risposta concisa e non tecnica, questo è complementare alla risposta di Andy, ma non credo che riguardi "Possiamo davvero fidarci delle stime della differenza in differenza?"
Silverfish,

0

Attenzione:

Vale la pena notare altri due punti. In primo luogo, 80 dei 92 documenti DD originali hanno un potenziale problema con termini di errore raggruppati in quanto l'unità di osservazione è più dettagliata del livello di variazione (un punto discusso da Donald e Lang [2001]). Solo 36 di questi articoli affrontano questo problema, raggruppando gli errori standard o aggregando i dati. In secondo luogo, vengono utilizzate diverse tecniche (più o meno informali) per gestire la possibile endogeneità della variabile di intervento. Ad esempio, tre articoli includono una variabile dipendente ritardata nell'equazione (1), sette includono una tendenza temporale specifica per gli stati trattati, quindici tracciano alcuni grafici per esaminare la dinamica dell'effetto del trattamento, tre esaminano se esiste un "effetto" prima la legge, due verifica se l'effetto è persistente, e undici tentano formalmente di fare differenze triple (DDD) trovando un altro gruppo di controllo. In Bertrand, Duflo e Mullainathan [2002] mostriamo che la maggior parte di queste tecniche non allevia i problemi di correlazione seriale.

(Bertrand, Duflo e Mullainathan 2004, 253)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.