Specifica di una differenza nel modello di differenze con più periodi di tempo


20

Quando stima una differenza nel modello di differenze con due periodi di tempo, il modello di regressione equivalente sarebbe

un. Yist=α+γsTreatment+λdt+δ(Treatmentdt)+ϵist

  • dove il è un manichino che è uguale a 1 se l'osservazione proviene dal gruppo di trattamentoTreatment
  • e è un manichino che è uguale a 1 nel periodo di tempo successivo al trattamentod

Pertanto l'equazione assume i seguenti valori.

  • Gruppo di controllo, prima del trattamento:α
  • Gruppo di controllo, dopo il trattamento:α+λ
  • Gruppo di trattamento, prima del trattamento:α+γ
  • Gruppo di trattamento, dopo il trattamento: α+γ+λ+δ

Quindi, in un modello a due periodi, la differenza nella stima delle differenze è .δ

Ma cosa succede riguardo a se ho più di un periodo pre e post trattamento? Uso ancora un manichino che indica se un anno è prima o dopo il trattamento?dt

Oppure aggiungo invece i manichini dell'anno senza specificare se ogni anno appartiene al periodo pre o post trattamento? Come questo:

b. Yist=α+γsTreatment+yeardummy+δ(Treatmentdt)+ϵist

O posso includere entrambi (cioè )?yeardummy+λdt

c. Yist=α+γsTreatment+yeardummy+λdt+δ(Treatmentdt)+ϵist

In conclusione, come posso specificare una differenza nel modello di differenze con più periodi di tempo (a, b o c)?


1
In genere si utilizza il modello b. Si noti che nel modello c, sarà perfettamente collineare con i manichini dell'anno, quindi quel modello non può essere stimato. dt
standard_error,

Sarebbe bello se potessi spiegare perché b è usato in generale. Forse dare alcuni riferimenti, o semplicemente dare una spiegazione di 2 frasi.
mpiktas,

e nel modello b. potresti aggiungere una variabile continua per anno invece che per i manichini? In che modo l'interpretazione dei coefficienti differirebbe in questi casi?

Risposte:


19

Il modo tipico di stimare una differenza nel modello di differenze con più di due periodi di tempo è la soluzione proposta b). Mantenendo la tua notazione, regrediresti dove è una variabile fittizia che è uguale a una per le unità di trattamento nel periodo post-trattamento ( ) ed è zero altrimenti. Si noti che questa è una formulazione più generale della differenza nella regressione delle differenze che consente diversi tempi del trattamento per le diverse unità trattate. D tTrattamento sd t s d t = 1

Yist=α+γs(Treatments)+λ(year dummyt)+δDst+ϵist
DtTreatmentsdtsdt=1

Come sottolineato correttamente nei commenti, la soluzione proposta c) non funziona a causa della collinearità con i manichini temporali e il manichino per il periodo post-trattamento. Tuttavia, una leggera variante di questo risulta essere un controllo di robustezza. Sia e due set di variabili fittizie per ciascuna unità di controllo e ciascuna unità trattata , rispettivamente, quindi interagendo con i manichini per le unità trattate con la variabile temporale e regredendo include una tendenza temporale specifica per unità γ s 1 s 0 s 1 t Y i s t = γ s 0 + γ s 1 t + λ ( anno fittizio t ) + δ D s t + ϵ i s t γ s 1 t δγs0γs1s0s1t

Yist=γs0+γs1t+λ(year dummyt)+δDst+ϵist
γs1t. Quando si includono queste tendenze temporali specifiche dell'unità e la differenza nel coefficiente di differenze non cambia in modo significativo, si può essere più sicuri dei risultati. Altrimenti potresti chiederti se il tuo effetto terapeutico ha assorbito le differenze tra le unità trattate a causa di una tendenza temporale sottostante (può accadere quando le politiche entrano in azione in momenti diversi nel tempo).δ

Un esempio citato in Angrist e Pischke (2009) Mostly Harmless Econometrics è uno studio di politica del mercato del lavoro di Besley e Burgess (2004) . Nel loro articolo accade che l'inclusione di tendenze temporali specifiche per stato uccida l'effetto di trattamento stimato. Si noti tuttavia che per questo controllo di robustezza sono necessari più di 3 periodi di tempo.


Un seguito dato che sto cercando di decidere se implementare questo con alcuni dati amministrativi è appropriato: Diresti che un approccio DD è più valido di un progetto CITS se ci sono solo 4 punti temporali (2 pre e 2 post) in un modello? Inoltre, se ho più coorti all'interno di ondate di dati, queste dovrebbero essere esaminate separatamente o in un modello unificato? Grazie.
bfoste01,

@Andy: puoi spiegare cosa intendi per s0, s1 e l'andamento temporale specifico dell'unità? Supponendo che ho due giornali (WPT e NYT) e WPT è il mio gruppo di trattamento, quale di questi sarebbe s0 e s1?
user3683131

1
Ho ragione nel pensare che questa analisi confronta la media pre e post trattamento e non tiene conto delle tendenze secolari? vale a dire se d_t = 0 per tutti i periodi di tempo prima del punto di commutazione e d_t = 1 per tutti i periodi di tempo successivi, questa analisi è essenzialmente la stessa dei due periodi di tempo uno, tranne per il fatto che viene presa la media di tutti i tempi di prima / dopo periodi. In qualsiasi momento le tendenze del risultato prima / dopo il passaggio al trattamento vengono ignorate? Sto cercando di decidere se un modello DiD è corretto per un'analisi che sto pianificando di eseguire.
AP30

0

Vorrei chiarire qualcosa (e indirettamente indirizzare una domanda nei commenti). In particolare, riguarda l'uso di tendenze temporali lineari specifiche per unità. Come controllo di robustezza, sembrerebbe che tu stia interagendo solo con i manichini per le unità trattate (ad esempio, ) con un andamento temporale continuo. Tuttavia, in realtà è il caso di interagire con un set completo di manichini unità / stato (effetti fissi unità / stato) con una variabile di tendenza temporale lineare.γ1s

Angrist e Pischke (2009) raccomandano questo approccio a pagina 238 in Mostly Harmless Econometrics . Le differenze di notazione possono causare confusione. Riproduzione delle specifiche 5.2.7:

yist=γ0s+γ1st+λt+δDst+Xistβ+εist,

dove è un'intercetta specifica dello stato , in conformità con il pedice utilizzato nel loro libro. È possibile visualizzare come coefficiente di tendenza specifico dello stato moltiplicando la variabile di tendenza temporale, . Articoli diversi usano notazioni diverse. Ad esempio, Wolfers (2006) replica un modello che incorpora tendenze temporali lineari specifiche dello stato. Riproduzione del modello (1):γ0ssγ1st

ys,t=sStates+tYeart+sStatesTimet+δDs,t+εs,t,

dove il modello include effetti fissi di stato e anno (ad esempio manichini per ogni stato e anno). La variabile di trattamento è quando lo stato adotta un regime di divorzio unilaterale nel periodo . Notare che questa specifica interagisce con i manichini di stato con una tendenza temporale lineare (cioè ). Questa è un'altra rappresentazione delle tendenze temporali lineari specifiche dello stato nelle specifiche del modello.Ds,tstTimet

Le tendenze temporali lineari specifiche dell'unità sono anche affrontate in un altro post (vedi sotto):

Come rendere conto del posizionamento del programma endogeno?

In breve, si desidera interagire tutti i manichini di unità (gruppo) con una variabile di tendenza temporale continua.

L'articolo di Justin Wolfers è il seguente per riferimento:

https://users.nber.org/~jwolfers/papers/Divorce(AER).pdf

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.