Inclusione della variabile dipendente ritardata nella regressione


26

Sono molto confuso se è legittimo includere una variabile dipendente ritardata in un modello di regressione. Fondamentalmente penso che se questo modello si concentra sulla relazione tra la variazione in Y e altre variabili indipendenti, quindi l'aggiunta di una variabile dipendente ritardata nella parte destra può garantire che il coefficiente prima di altri IV sia indipendente dal valore precedente di Y.

Alcuni sostengono che l'inclusione di LDV scoraggerà verso il basso il coefficiente di altri IV. Alcuni altri affermano che si può includere LDV che può ridurre la correlazione seriale.

So che questa domanda è piuttosto generale in termini di quale tipo di regressione. Ma la mia conoscenza statistica è limitata e faccio davvero fatica a capire se dovrei includere una variabile dipendente ritardata in un modello di regressione quando il focus è il cambiamento di Y nel tempo.

Esistono altri approcci per gestire l'influenza di X sul cambiamento di Y nel tempo? Ho provato diversi punteggi di cambiamento anche come DV, ma la R al quadrato in quella situazione è molto bassa.


1
cosa speri di ottenere con il tuo modello? L'ottimizzazione dell'R-quadrato è raramente un buon criterio di selezione del modello.
Michael Bishop,

Questo modello verrà utilizzato per la previsione. È vero che sebbene il R-quadrato differisca molto, i valori previsti sono effettivamente gli stessi usando Y o il cambio di Y. Tuttavia, dato il basso valore del R-quadrato usando il cambio di Y come DV, significa che il l'attuale set di IV non è in grado di spiegare molto bene il cambiamento e ci devono essere alcune variabili omesse?
user22109

Risposte:


19

La decisione di includere una variabile dipendente ritardata nel modello è in realtà una domanda teorica. È logico includere un DV ritardato se ci si aspetta che il livello corrente del DV sia fortemente determinato dal suo livello passato. In tal caso, escludendo il DV ritardato si otterrà una distorsione da variabile omessa e i risultati potrebbero non essere affidabili. In uno scenario del genere, incluso il DV ritardato, eliminerai molto la tua varianza e probabilmente renderai gli effetti degli altri tuoi DV meno significativi (il che significa sia che rimpiccioliscano gli sia gli errori standard). Tuttavia, ciò che ti permetterà di fare è dire che quei IV che influenzano ancora il tuo risultato hanno un effetto che controlla il valore passato del DV. Un approccio alternativo a questo è utilizzare la differenza tra la variabile del risultato nel periodoβte come DV per il periodo .t-1t

Tuttavia, fare uno di questi implica rispondere a una domanda importante: qual è la giusta struttura di ritardo per il tuo DV? Puoi ottenere alcune informazioni a riguardo osservando la correlazione tra la tua variabile di risultato con se stessa per diversi valori di ritardo (ad es. Correlazione tra Y e Y , Y e Y , ecc.).t-1t-2


12

Raccomando due articoli:

  1. Achen CH (2001) Perché le variabili dipendenti ritardate possono sopprimere il potere esplicativo di altre variabili indipendenti ( link )
  2. Keele, L. e Kelly NJ (2005) Modelli dinamici per teorie dinamiche: i dettagli delle variabili dipendenti ritardate ( link ).

Il risultato è che l'inclusione di una variabile dipendente ritardata può avere una grande influenza sui coefficienti delle restanti variabili. A volte questo è appropriato (per i modelli dinamici di Keele e Kelly) e talvolta no. Come altri hanno già detto, è importante pensare al processo che viene modellato.


4

L'inclusione di variabili dipendenti ritardate può ridurre il verificarsi dell'autocorrelazione derivante dalla mancata specificazione del modello. Pertanto, la contabilizzazione delle variabili dipendenti ritardate aiuta a difendere l'esistenza dell'autocorrelazione nel modello. Il valore passato influisce sul presente nel modello, richiede basi teoriche e si adatta meglio al modello secondo necessità.


Non sono sicuro di aver reso giustizia all'ultima frase; si prega di modificare se il significato può essere chiarito. Benvenuti in Cross Validated BTW!
Nick Stauner,

1
L'autocorrelazione può essere un artefatto del modo in cui i dati vengono raccolti. Ho ottenuto i dati digitalizzando un diagramma che significava che i dati erano ordinati. Questo ordinamento e la relazione non lineare hanno causato autocorrelazione nei residui.
Tony Ladson,

2

Ciò che mi incuriosisce di questa domanda non è conoscere meglio le specifiche del modello o la tecnica di stima per questo. Dico che poiché sebbene l'uso di un DV ritardato tra gli IV possa essere teoricamente importante e metodologicamente necessario, può anche introdurre una quantità rischiosa di endongeneità nel modello, a seconda della relazione sostanziale tra variabili e unità di tempo e, inoltre, sull'AR ordine che può esistere nel modello. A meno che tu (e noi) non abbia maggiori dettagli sulle variabili e sulla stima, non mi sentirei a mio agio a raccomandare un ritardo del DV a meno che tu non stia pensando a qualche tecnica variabile strumentale o qualcosa come la stima di Arellano-Bond.

Per favore, forniscici maggiori dettagli in modo che possiamo conoscere meglio il tipo di modello di cui stiamo parlando.


0

Sì, dovresti diffidare del pregiudizio di Nickell in una piccola situazione di grande N (Nickell, S. (1981). Distorsioni in modelli dinamici con effetti fissi. Econometrica: Journal of the Econometric Society, 1417-1426.)

Potresti voler esaminare i modelli Dynamic Panel Data come gli stimatori Arellano-Bond o Blundell-Bond.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.