Perché usare le variabili di controllo nelle differenze nelle differenze?


10

Ho una domanda sull'approccio delle differenze nelle differenze con la seguente equazione standard: dove trattare è una variabile dummy per il gruppo trattato e post.

y=a+b1treat+b2post+b3treatpost+u

Ora, la mia domanda è semplice: perché la maggior parte dei documenti utilizza ancora variabili di controllo aggiuntive? Ho pensato che se il presupposto della tendenza parallela fosse corretto, non dovremmo preoccuparci di controlli aggiuntivi. Potrei solo pensare a 2 possibili motivi per cui utilizzare le variabili di controllo:

  1. senza di essi le tendenze non sarebbero parallele
  2. poiché la specifica DnD attribuisce eventuali differenze nelle tendenze tra il trattamento e il gruppo di controllo al momento del trattamento all'intervento (ovvero il termine di interazione trattamento * post) - quando non controlliamo per altre variabili, il coefficiente dell'interazione potrebbe essere sopra - / sobrio

Qualcuno potrebbe fare luce su questo problema? I miei motivi 1) o 2) hanno senso? Non capisco completamente l'uso delle variabili di controllo in DnD.


La necessità di ulteriori variabili di controllo può dipendere dal fatto che il gruppo di trattamento sia stato scelto a caso da un gruppo più ampio con il resto che diventa controlli o (come è più spesso il caso nell'analisi post-hoc) a causa di alcune caratteristiche specifiche.
Henry,

Risposte:


5

senza di essi [ovvero variabili aggiuntive], le tendenze non sarebbero parallele

Sì, è giusto. Potrebbero esserci tendenze specifiche per unità che non vengono prese in considerazione a meno che non si aggiungano variabili che variano nel tempo al modello.

Anche se il presupposto delle tendenze parallele è soddisfatto senza variabili aggiuntive, l'aggiunta di variabili aggiuntive può aumentare la precisione delle stime, proprio come in altre regressioni. Penso che questo sia parte di ciò che Michael Chernick ha in mente.

Principalmente Harmless Econometrics ha una bella discussione che può essere utile. Vedi in particolare le pagine 236-37.


1

A volte, quando osserviamo l'effetto di un trattamento calcolando la differenza tra la risposta post trattamento o il pretrattamento, diciamo che il paziente agisce come suo controllo. Lo scopo di fornire un gruppo di controllo è rendere conto del cosiddetto effetto placebo. A volte può esserci un cambiamento positivo anche se il trattamento non viene applicato. Quindi l'effetto che vogliamo determinare è l'aumento medio al di sopra dell '"effetto placebo".


Ciao Michael, grazie per la tua risposta. Penso di capire perché abbiamo bisogno di gruppi di controllo. Il gruppo di controllo è incorporato nella mia equazione di regressione come coloro che non hanno treat = 1. Quindi questa non è davvero la domanda qui. La domanda è perché alcuni documenti utilizzano variabili di controllo aggiuntive in cima all'equazione sopra indicata. Sarebbe bello se tu potessi rispondere su questo o forse qualcun altro. Grazie ragazzi!
procedi il

Perché chiamate le variabili di controllo variabili aggiuntive? L'unica ragione che ho potuto vedere includendo ulteriori variabili nel modello sarebbe che le variabili possono spiegare alcune delle variazioni nella risposta che non sono state spiegate dalle altre variabili nel modello.
Michael R. Chernick,

Bene, questa è fondamentalmente la mia domanda: perché includere queste variabili (cioè le variabili di controllo che sono incluse perché, come dici tu, potrebbero spiegare qualcosa che sosteniamo il trattamento spiega) quando si assume che l'ipotesi del trend parallelo sia valida? Potrei solo supporre che includere ulteriori controlli significhi rilassare tale presupposto, ovvero vedere quanto il trattamento può spiegare, anche quando si controllano altre variabili. Ciò potrebbe essere una conseguenza del fatto di non essere in grado di testare completamente il presupposto della tendenza parallela e di convincere il lettore di più sull'effetto del trattamento. Ma non ne sono sicuro
esecuzioni

L'effetto sulla risposta non deve provenire esclusivamente dal trattamento. Sto dicendo che altre variabili potrebbero essere in grado di spiegare le variazioni nella risposta che sono indipendenti dal trattamento. Non ha nulla a che fare con il trattamento che interagisce con nulla.
Michael R. Chernick,


1

Continuando la risposta di Michael, vuoi fornire quante più prove possibili che E [u | treat] = 0. Questo è un presupposto e mai direttamente verificabile, ma vuoi fornire ai lettori tanta fiducia che hai pensato sul perché può contenere. L'aggiunta efficace dei controlli inizia a decomporsi. Inoltre, alcuni controlli potrebbero non ottenere tutto ciò che desideri, ma potrebbero darti un'idea del tipo di cose di cui potresti non aver bisogno di preoccuparti. Ad esempio, se avessi un controllo per il QI, ciò potrebbe aiutare a dissipare le preoccupazioni sulle variabili omesse sull'abilità.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.