Mi chiedo come una variabile strumentale affronti il bias di selezione nella regressione.
Ecco l'esempio che sto masticando: in Mostly Harmless Econometrics , gli autori discutono di una regressione IV relativa al servizio militare e ai guadagni più avanti nella vita. La domanda è: "Il servizio militare aumenta o diminuisce i guadagni futuri?" Indagano su questa domanda nel contesto della guerra del Vietnam. Capisco che il servizio militare non può essere assegnato in modo casuale e che questo è un problema per l'inferenza causale.
Per affrontare questo problema, il ricercatore utilizza la bozza di ammissibilità (come in "il tuo numero di bozza è chiamato") come strumento per il servizio militare effettivo. Questo ha senso: il progetto del Vietnam ha assegnato casualmente giovani americani ai militari (in teoria - se gli sfollati effettivamente servivano tocchi alla mia domanda). La nostra altra condizione IV sembra solida: i progetti di ammissibilità e il servizio militare effettivo sono fortemente, positivamente correlati.
Ecco la mia domanda Sembra che avresti un pregiudizio all'auto-selezione: forse i bambini più ricchi possono uscire dal servizio in Vietnam, anche se i loro numeri di bozza vengono chiamati. (Se ciò non fosse effettivamente il caso, fingiamo per il bene della mia domanda). Se questa auto-selezione crea una distorsione sistemica all'interno del nostro campione, in che modo la nostra variabile strumentale affronta questa distorsione? Dobbiamo restringere il nostro ambito di inferenza ai "tipi di persone che non sono riuscite a sfuggire alla bozza?" O il IV in qualche modo salva quella parte della nostra inferenza? Se qualcuno potesse spiegare come funziona, sarei molto grato.