Per coloro che non hanno familiarità con il seguente frammento di codice di Stata, l'OP ha fornito
ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)
questa equazione può essere letta come
Yt=α+β1(Var1)+β2(Var1)+β3(Var1)+β4(Y~t−1)
dove è stimato daY~t−1
Y~t−1=α+Z1(Δ2Yt)+Z2(Δ3Yt)+Z3(Δ4Yt)
(ovvero il primo stadio dell'equazione IV si trova tra parentesi nel codice Stata)
I delta rappresentano le differenze del secondo, terzo e quarto ordine e vengono utilizzati come strumenti esclusi per stimare il ritardo della variabile dipendente.
Nel codice Stata, L.
indica che la variabile è in ritardo di e indica le differenze del primo ordine di quella variabile, e quindi indica la differenza del secondo ordine.t−1D.
D2.
Inizialmente non riuscivo a pensare a nessun ragionamento logico per cui qualcuno avrebbe fatto questo. Ma Kwak ha sottolineato (facendo riferimento a questo documento ) che il metodo Arellano-Bond utilizza le differenze come strumenti per stimare la componente auto-regressiva del modello. (Anche inizialmente avevo ipotizzato che le differenze avrebbero avuto un effetto solo se la serie non fosse stazionaria, che Bond afferma in quel documento collegato che le differenze saranno strumenti deboli solo nel caso in cui la serie sia una passeggiata casuale, a pag. 21 )
Come suggerimenti su ulteriore materiale di lettura come introduzione a variabili strumentali,
Un altro poster di questa risposta (Charlie) collegato ad alcune diapositive che ha preparato che mi piace e che suggerirebbe che valga la pena cercare un'introduzione alle variabili strumentali. Vorrei anche suggerire questo powerpoint a un mio professore preparato per un seminario come introduzione. Come ultimo suggerimento per chiunque venga istruito a saperne di più sulle variabili strumentali, dovresti cercare il lavoro di Joshua Angrist.
Ecco la mia risposta iniziale
Sebbene sia d'accordo con tutto ciò che Kwak e ars hanno affermato, non riesco ancora a pensare a nessun motivo per cui qualcuno dovrebbe usare le differenze della variabile dipendente come strumenti per stimare il ritardo della variabile dipendente (se le persone non conoscono il codice Stata, il L.
indica che quella variabile è in ritardo di e indica le differenze del primo ordine di quella variabile, e quindi indica la differenza del secondo ordine).t−1D.
D2.
In tutte le applicazioni che ho visto, le persone usano il ritardo di variabili indipendenti come strumenti per stimare il ritardo della variabile dipendente (per motivi di cui parla). Ma ciò si basa sul presupposto che le variabili indipendenti ritardate siano esogene al termine dell'errore nel periodo di tempo in cui vengono applicate.
Non conosco alcun ragionamento in cui le differenze della variabile dipendente sarebbero considerate esogene. Per quanto ne so, non è accettata la pratica di differenziare solo un lato dell'equazione e produrrebbe risultati piuttosto illogici ( ecco un documento che critica qualcuno sulla situazione inversa in cui includevano un livello di variabili come predittore di una serie differenziata.) Se riorganizzi i termini nell'equazione IV, in realtà sembra simile a un test Dickey Fuller aumentato.
Mentre la risposta più semplice sarebbe quella di chiedere alla persona che ha scritto il codice, qualcuno può dare un esempio in cui questa procedura sarebbe accettabile o qualsiasi situazione in cui questa procedura restituirebbe risultati significativi? Come non riesco a pensare ad alcun ragionamento logico per cui le differenze avrebbero un effetto sui livelli tranne nel caso in cui la serie non sia stazionaria.