Probit minimi quadrati a due stadi (2SLS)

12

Mi è stato detto che è possibile eseguire una regressione IV a due stadi in cui il primo è un probit e il secondo è un OLS. È possibile utilizzare 2SLS se il primo stadio è un probit ma il secondo è un modello probit / poisson?

— user3543169
fonte

18

Ciò che ti è stato proposto viene talvolta definito regressione proibita e in generale non stimerai in modo coerente il rapporto di interesse. Le regressioni proibite producono stime coerenti solo in base a presupposti molto restrittivi che raramente valgono in pratica (si veda ad esempio Wooldridge (2010) "Analisi econometrica dei dati di una sezione trasversale", p. 265-268).

Il problema è che né l'operatore delle aspettative condizionate né la proiezione lineare svolgono funzioni non lineari. Per questo motivo, solo una regressione OLS nella prima fase è garantita per produrre valori adattati che non sono correlati ai residui. Una prova di ciò può essere trovata in "Analisi econometrica" di Greene (2008) o, se si desidera una prova più dettagliata (ma anche più tecnica), è possibile dare un'occhiata alle note di Jean-Louis Arcand a pag. Da 47 a 52.

Per lo stesso motivo della regressione proibita, questa procedura in due fasi apparentemente ovvia per imitare 2SLS con probit non produrrà stime coerenti. Questo perché le aspettative e le proiezioni lineari non si ripercuotono su funzioni non lineari. Wooldridge (2010) nella sezione 15.7.3 a pagina 594 fornisce una spiegazione dettagliata per questo. Spiega anche la corretta procedura di stima dei modelli probit con una variabile endogena binaria. L'approccio corretto è utilizzare la massima probabilità, ma farlo a mano non è esattamente banale. Pertanto è preferibile avere accesso ad alcuni software statistici che hanno un pacchetto pronto per questo. Ad esempio, il comando Stata sarebbe ivprobit(vedere il manuale Stata per questo comando che spiega anche l'approccio della massima verosimiglianza).

Se hai bisogno di riferimenti per la teoria dietro probit con variabili strumentali, vedi ad esempio:

Newey, W. (1987) "Stima efficiente di modelli variabili dipendenti limitati con variabili esplicative endogene", Journal of Econometrics, Vol. 36, pagg. 231-250
Rivers, D. e Vuong, QH (1988) "Stimatori di informazioni limitate e test di esogeneità per modelli probit simultanei", Journal of Econometrics, Vol. 39, pagg. 347-366

Infine, è difficile combinare diversi metodi di stima nella prima e nella seconda fase a meno che non esista una base teorica che giustifichi il loro uso. Questo non vuol dire che non è fattibile però. Ad esempio, Adams et al. (2009) utilizzano una procedura in tre fasi in cui hanno un "primo stadio" probit e un secondo stadio OLS senza cadere per il problema della regressione proibita. Il loro approccio generale è:

usa probit per regredire la variabile endogena sullo strumento (i) e le variabili esogene
utilizzare i valori previsti dal passaggio precedente in un primo stadio OLS insieme alle variabili esogene (ma senza strumentale)
fare il secondo stadio come al solito

Una procedura simile è stata impiegata da un utente dello Statalista che voleva utilizzare un primo stadio Tobit e un secondo stadio Poisson (vedi qui ). La stessa soluzione dovrebbe essere fattibile per il tuo problema di stima.

— Andy
fonte

1

Come accennato nel altra risposta, la "regressione proibito" sembra essere circa l'inclusione di diversi set di covariate nel primo stadio rispetto ai modelli secondo stadio, non sulla prima fase non-lineare seguita da lineare 2 ° stadio. Dalla discussione di Arcand, p.47: "In parole, la corretta procedura 2SLS comporta l'inclusione di tutte le covariate esogene che compaiono nell'equazione strutturale nella forma ridotta del primo stadio. La regressione proibita comporta il lasciarne alcune o tutte. " Ciò che l'OP propone non sembra essere un esempio di regressione proibita ...

— landroni

2

se vuoi una prova più dettagliata (ma anche più tecnica), puoi dare un'occhiata alle note di Jean-Louis Arcand a pag. Da 47 a 52.

Questo non sembra essere il caso. La discussione su Arcand non riguarda la forma funzionale; si tratta invece dell'inclusione di diversi set di covariate nel primo stadio rispetto ai modelli del secondo stadio. "In parole, la corretta procedura 2SLS comporta l'inclusione di tutte le covariate esogene che compaiono nell'equazione strutturale nella forma ridotta del primo stadio. La regressione proibita comporta l'abbandono di alcuni o tutti."

Tornando alla domanda originale, consiglierei di usare un OLS per il primo stadio e il probit per il secondo. Anche se questo può essere tecnicamente di parte, è probabile (supponendo che tu abbia un buon strumento) di essere meno distorto rispetto all'approccio non IV.

— draypresct
fonte