Qual è la differenza nello stimatore delle
differenze La differenza nelle differenze (DiD) è uno strumento per stimare gli effetti del trattamento confrontando le differenze pre e post trattamento nel risultato di un trattamento e di un gruppo di controllo. In generale, siamo interessati a stimare l'effetto di un trattamento (ad es. Stato sindacale, farmaci, ecc.) Su un risultato Y i (es. Salari, salute, ecc.) Come in
Y i t = α i + λ t + ρ D i t + X ′ i t β + ϵ i t
dove αDiYi
Yit=αi+λt+ρDit+X′itβ+ϵit
sono individuali effetti fissi (caratteristiche degli individui che non cambiano nel corso del tempo),
λ t sono il tempo effetti fissi,
X i t sono covariate variabili nel tempo come l'età degli individui, e
ε i t è un termine di errore. Gli individui e il tempo sono indicizzati rispettivamente da
i e
t . Se esiste una correlazione tra gli effetti fissi e
D i t, la stima di questa regressione tramite OLS sarà distorta dato che gli effetti fissi non sono controllati per. Questa è la tipica
distorsione da variabile omessa.
αiλtXitϵititDit
t=1,2s=A,B
ρ=(E[Yist|s=A,t=2]−E[Yist|s=A,t=1])−(E[Yist|s=B,t=2]−E[Yist|s=B,t=1])
Graficamente questo sarebbe simile a questo:
AB
- controllare per le covariate
- per ottenere errori standard per l'effetto del trattamento per vedere se è significativo
treatiAtimett=2
Yit=β1+β2(treati)+β3(timet)+ρ(treati⋅timet)+ϵit
Tit
Yit=β1γs+β2λt+ρTit+ϵit
γsλt
E(Y0it|i,t)=αi+λtE(Y0it|s,t)=γs+λts
Possiamo fidarci della differenza nelle differenze?
Il presupposto più importante in DiD è il presupposto delle tendenze parallele (vedere la figura sopra). Non fidarti mai di uno studio che non mostra graficamente queste tendenze! Gli articoli negli anni '90 potrebbero essersene andati bene, ma oggigiorno la nostra comprensione di DiD è molto meglio. Se non esiste un grafico convincente che mostri le tendenze parallele nei risultati pre-trattamento per i gruppi di trattamento e controllo, sii prudente. Se il presupposto delle tendenze parallele è valido e possiamo escludere in modo credibile qualsiasi altra variazione nel tempo che possa confondere il trattamento, allora DiD è un metodo affidabile.
Un'altra parola di cautela dovrebbe essere applicata quando si tratta del trattamento degli errori standard. Con molti anni di dati è necessario regolare gli errori standard per l'autocorrelazione. In passato, questo è stato trascurato, ma da quando Bertrand et al. (2004) "Quanto dovremmo fidarci delle stime delle differenze nelle differenze?" sappiamo che questo è un problema. Nel documento forniscono diversi rimedi per gestire l'autocorrelazione. Il più semplice è raggruppare l'identificatore del singolo pannello che consente una correlazione arbitraria dei residui tra le singole serie temporali. Ciò corregge sia l'autocorrelazione che l'eteroscedasticità.
Per ulteriori riferimenti vedere queste note di conferenza di Waldinger e Pischke .