Anche se questa domanda ha già una risposta accettata, penso di poter ancora contribuire a questo. Il libro Koenker (2005) non ti porterà davvero lontano perché gli sviluppi nella IV regressione quantile hanno iniziato a riprendersi da quel momento.
Le prime tecniche di regressione quantile IV includono la struttura della catena causale di Chesher (2003) , che è stata ulteriormente sviluppata nell'approccio ponderato delle deviazioni medie (WAD) di Ma e Koenker (2006) . In questo articolo introducono anche l'approccio delle variabili di controllo. Un'idea simile è stata usata da Lee (2007) che ha derivato uno stimatore della regressione quantile IV usando le funzioni di controllo.
Tutti questi stimatori fanno uso di una presunta struttura di errore triangolare necessaria per l'identificazione. Il problema è che questa struttura triangolare non è plausibile per problemi di endogeneità che sorgono a causa della simultaneità. Ad esempio, non è possibile utilizzare questi stimatori per un problema di stima della domanda e dell'offerta.
Lo stimatore di Abadie, Angrist e Imbens (2002), menzionato da Dimitriy V. Masterov, presuppone che tu abbia sia una variabile endogena binaria che uno strumento binario. In generale, si tratta di un framework molto restrittivo, ma estende l'approccio LATE dalla regressione lineare IV alle regressioni quantili. Questo è carino perché molti ricercatori, specialmente in economia, hanno familiarità con il concetto LATE e l'interpretazione dei coefficienti risultanti.
Il seminario di Chernozhukov e Hansen (2005) ha dato il via a questa letteratura e questi due ragazzi hanno lavorato molto in questo settore. Lo stimatore di regressione quantile IV (IVQR) fornisce un collegamento naturale allo stimatore 2SLS nel contesto quantile. Il loro stimatore è implementato tramite Matlab o Ox, come ha sottolineato Dimitriy, ma puoi dimenticare quel documento di Kwak (2010). Questo documento non è mai stato pubblicato sul giornale Stata e anche il suo codice non viene eseguito correttamente. Presumo abbia abbandonato questo progetto.
Dovresti invece considerare lo stimatore di equazioni di stima livellate IVQR (SEE-IVQR) di Kaplan e Sun (2012). Questo è uno stimatore recente che è un miglioramento rispetto allo stimatore IVQR originale in termini di velocità computazionale (evita il pesante algoritmo di ricerca della griglia) e errore quadratico medio. Il codice Matlab è disponibile qui .
L'articolo di Frölich e Melly (2010) è carino perché considera la differenza tra regressione quantistica condizionale e incondizionata. Il problema con la regressione quantile in generale è che una volta incluse le covariate nella regressione, l'interpretazione cambia. In OLS puoi sempre passare dall'aspettativa condizionale a quella incondizionata attraverso la legge delle aspettative iterate, ma per i quantili questo non è disponibile. Questo problema è stato mostrato per la prima volta da Firpo (2007) e Firpo et al. (2009). Usa una funzione di influenza ricentrata per emarginare i coefficienti di regressione quantile condizionale in modo tale che possano essere interpretati come i soliti coefficienti OLS. Per il tuo scopo, questo stimatore non aiuterà molto perché consente solo variabili esogene. Se sei interessato, Nicole Fortin rende disponibile il codice Stata sul suo sito web.
Il più recente stimatore incondizionato della regressione quantistica IV che conosco è di Powell (2013) . Il suo stimatore di regressione quantistica generalizzato (IV) consente di stimare gli effetti marginali del trattamento quantile in presenza di endogeneità. Da qualche parte sul sito web RAND rende disponibile anche il suo codice Stata, ma non sono riuscito a trovarlo proprio ora. Da quando lo hai chiesto: in un precedente documento aveva implementato questo stimatore nel contesto dei dati del panel (vedi Powell, 2012 ). Questo stimatore è eccezionale perché, a differenza di tutti i precedenti metodi QR di dati panel, questo stimatore non si basa su grandi asintotici T (che di solito non si hanno, almeno non nei dati microeconometrici).
Ultimo ma non meno importante, una variante più esotica: lo stimatore IVQR censurato (CQIV) di Chernozhukov et al. (2011) consente di occuparsi dei dati censurati, come suggerisce il nome. È un'estensione del documento di Chernozhukov e Hong (2003) che non collego perché non è per il IV contesto. Questo strumento di calcolo è pesante dal punto di vista computazionale, ma se hai dati censurati e nessun altro modo per aggirarli, questa è la strada da percorrere. Amanda Kowalski ha pubblicato il codice Stata sul suo sito Web oppure è possibile scaricarlo da RePEc. Questo stimatore (e, tra l'altro, anche IVQR e SEE-IVQR) presume che tu abbia una variabile endogena continua. Ho usato questi stimatori nel contesto delle regressioni degli utili in cui l'educazione era la mia variabile endogena che prendeva tra 18 e 20 valori, quindi non esattamente continua. Ma negli esercizi di simulazione ho sempre potuto dimostrare che questo non è un problema. Tuttavia, questo dipende probabilmente dall'applicazione, quindi se decidi di utilizzarlo, ricontrolla.