La risposta di JohnRos è molto buona. In parole povere, l'endogeneità significa che hai sbagliato la causalità. Che il modello che hai scritto e stimato non cattura correttamente il modo in cui la causalità funziona nel mondo reale. Quando scrivi:
Yi=β0+β1Xi+ϵi
puoi pensare a questa equazione in vari modi. Potresti pensarlo come un modo conveniente per prevedere base ai valori diPotresti considerarlo un modo conveniente per modellare . In entrambi questi casi, non esiste l'endogeneità e non devi preoccuparti.X E { Y | X }YXE{Y|X}
Tuttavia, puoi anche pensare all'equazione come incarnazione della causalità. Puoi pensare a come la risposta alla domanda: "Cosa accadrebbe a se raggiungessi questo sistema e aumentassi sperimentalmente di 1?" Se vuoi pensarci in questo modo, usare OLS per stimarlo equivale a supporre che: Y Xβ1YX
- YX causaY
- Yϵ causaY
- Xϵ non causaX
- XY non causaX
- Nulla che causa causa ancheXϵX
Il fallimento di uno qualsiasi dei 3-5 si tradurrà generalmente in , o, non abbastanza equivalentemente, . Le variabili strumentali sono un modo per correggere il fatto che hai sbagliato la causalità (facendo un'altra ipotesi causale diversa). Una sperimentazione controllata randomizzata perfettamente condotta è un modo per forzare 3-5 a essere vero. Se scegli caso, allora sicuramente non è causato da , o altro. I cosiddetti metodi di "esperimento naturale" sono tentativi di trovare circostanze speciali nel mondo in cui 3-5 sono vere anche quando non pensiamo che 3-5 siano di solito vere.C o v ( X , ϵ ) ≠ 0 X Y ϵE{ϵ|X}≠0Cov(X,ϵ)≠0XYϵ
Nell'esempio di JohnRos, per calcolare il valore salariale dell'educazione, è necessaria un'interpretazione causale di , ma ci sono buoni motivi per ritenere che 3 o 5 siano falsi.β1
Tuttavia, la tua confusione è comprensibile. È molto tipico nei corsi sul modello lineare per l'istruttore usare l'interpretazione causale di ho dato sopra fingendo di non introdurre la causalità, fingendo che "sono solo statistiche." È una bugia codarda, ma è anche molto comune. β1
In realtà, fa parte di un fenomeno più ampio in biomedicina e scienze sociali. È quasi sempre il caso che stiamo cercando di determinare l'effetto causale di su --- questo è ciò di cui la scienza dopo tutto. D'altra parte, è anche quasi sempre il caso che ci sia una storia che puoi raccontare, portando a concludere che una delle 3-5 è falsa. Quindi, c'è una sorta di disonestà praticata, fluida ed equivoca in cui eliminiamo le obiezioni dicendo che stiamo solo facendo un lavoro associativo e poi nascondiamo l'interpretazione causale altrove (normalmente nelle sezioni introduzione e conclusione del documento).YXY
Se sei davvero interessato, il ragazzo da leggere è Judea Perl. Anche James Heckman è bravo.
R
.