Qual è la differenza tra regressione quantile condizionale e incondizionata?


38

Lo stimatore di regressione quantile condizionale di Koenker e Basset (1978) per il quantile è definito come dove \ rho_ \ tau = u_i \ cdot (\ tau - 1 (u_i <0)) è una funzione di ripesatura (chiamata funzione "check") dei residui u_i .τth

β^QR=minbi=1nρτ(yiXibτ)
ρτ=ui(τ1(ui<0))ui

In un articolo di Firpo et al. (2009) , gli autori affermano che la regressione quantistica condizionale non produce effetti interessanti. Dicono che i risultati condizionali non possono essere generalizzati alla popolazione (in OLS possiamo sempre passare da condizionali a incondizionati attraverso la legge delle aspettative iterate ma questo non è disponibile per i quantili). Questo perché il τth quantile incondizionato yi potrebbe non essere uguale al τth condizionale quantile yi|Xi .

Se ho capito bene, parte del problema è che quali covariate sono incluse in Xi ha un effetto sulla variabile di classificazione ui perché l'inclusione delle covariate divide l'errore in componenti osservati e non osservati. Non riesco proprio a capire perché questo causi problemi.

Ecco le mie domande:

  1. Cosa rende gli effetti quantici condizionali e incondizionati diversi l'uno dall'altro?
  2. Come posso interpretare i coefficienti delle regressioni quantili condizionali?
  3. Le regressioni quantili condizionali sono di parte?

Riferimenti:

  • Koenker, R. e Bassett, G. (1978) "Regressione Quantiles", Econometrica , Vol. 46 (1), pagg. 33-50.
  • Firpo, S. et al. (2009) "Regressioni quantili incondizionate", Econometrica , Vol. 77 (3), pagg. 953-973.

1
Ti consiglierei di consultare il capitolo 7 di "Econometria per lo più innocua" di Angrist e Pischke. Ha alcuni esempi di interpretazione del coefficiente di regressione quantile e delle implicazioni dei quantili condizionati a X. Sono d'accordo con te sul fatto che tali implicazioni non sono invalidanti per l'uso del modello a meno che tu non stia cercando di isolare l'impatto di una covariata. Penso che anche le regressioni quantili possano essere distorte; Angrist e Pischke esplorano alcuni metodi proposti per controllare, ad esempio, le variabili omesse.
Juan C,

1
Non una risposta, ma forse un indizio: la regressione quantile può essere lanciata come un problema di "dati mancanti", in cui i dati mancanti sono i pesi utilizzati nella regressione OLS ponderata. Ad esempio, l'utilizzo della distribuzione esponenziale per il peso inverso fornisce una regressione mediana ( ). τ=50
Probislogic

Risposte:


29

Configurazione
Supponiamo di avere una semplice regressione del modulo dove il risultato sono i guadagni di registro della persona , è il numero di anni di scuola e è un termine di errore. Invece di guardare solo l'effetto medio dell'educazione sui guadagni, che otterresti tramite OLS, vuoi anche vedere l'effetto in diverse parti della distribuzione dei risultati.

lnyi=α+βSi+ϵi
iSiϵi

1) Qual è la differenza tra l'impostazione condizionale e incondizionata Per
prima cosa tracciare le entrate del registro e scegliere tra due individui, e , dove è nella parte inferiore della distribuzione degli utili incondizionata e nella parte superiore. ABABinserisci qui la descrizione dell'immagine

Non sembra estremamente normale ma è perché ho usato solo 200 osservazioni nella simulazione, quindi non importa. Cosa succede se condizioniamo i nostri guadagni in anni di istruzione? Per ogni livello di istruzione otterresti una distribuzione degli utili "condizionale", cioè ti verrà fuori con un diagramma di densità come sopra, ma per ogni livello di istruzione separatamente.

inserisci qui la descrizione dell'immagine

Le due linee blu scuro sono i guadagni previsti dalle regressioni quantiche lineari alla mediana (linea inferiore) e al 90 ° percentile (linea superiore). Le densità rosse a 5 e 15 anni di istruzione ti danno una stima della distribuzione degli utili condizionale. Come vedi, la persona ha 5 anni di istruzione e la persona ha 15 anni di istruzione. Apparentemente, l'individuo sta andando abbastanza bene tra le sue pere nella fascia di istruzione di 5 anni, quindi è al 90 ° percentile.ABA

Quindi, una volta che ti condizioni su un'altra variabile, ora è successo che una persona si trova ora nella parte superiore della distribuzione condizionale, mentre quella persona sarebbe nella parte inferiore della distribuzione incondizionata - questo è ciò che cambia l'interpretazione dei coefficienti di regressione quantile . Perché?

Hai già detto che con OLS possiamo passare da applicando la legge delle aspettative iterate, tuttavia, questa è una proprietà dell'operatore aspettative che non è disponibile per i quantili (purtroppo!). Pertanto in generale , in qualsiasi quantile . Ciò può essere risolto eseguendo prima la regressione quantile condizionale e quindi integrando le variabili di condizionamento al fine di ottenere l'effetto marginale (l'effetto incondizionato) che è possibile interpretare come in OLS. Un esempio di questo approccio è fornito da Powell (2014) .E[yi|Si]=E[yi]Qτ(yi|Si)Qτ(yi)τ

2) Come interpretare i coefficienti di regressione quantile?
Questa è la parte difficile e non pretendo di possedere tutte le conoscenze al mondo su questo, quindi forse qualcuno trova una spiegazione migliore per questo. Come hai visto, il grado di un individuo nella distribuzione degli utili può essere molto diverso se si considera la distribuzione condizionale o incondizionata.

Per la regressione quantistica condizionale
Dal momento che non si può dire dove un individuo si troverà nella distribuzione dei risultati prima e dopo un trattamento, è possibile fare solo dichiarazioni sulla distribuzione nel suo insieme. Ad esempio, nell'esempio sopra un significherebbe che un ulteriore anno di istruzione aumenta le entrate nel 90 ° percentile della distribuzione degli utili condizionali (ma non sai chi è ancora in quel quantile prima di te assegnato alle persone un ulteriore anno di istruzione). Ecco perché le stime del quantile condizionale o gli effetti del trattamento del quantile condizionale spesso non sono considerati "interessanti". Normalmente vorremmo sapere come un trattamento influenza i nostri individui a portata di mano, non solo la distribuzione.β90=0.13

Per la regressione quantistica incondizionata
Questi sono come i coefficienti OLS che sei abituato a interpretare. La difficoltà qui non è l'interpretazione ma come ottenere quei coefficienti che non è sempre facile (l'integrazione potrebbe non funzionare, ad esempio con dati molto scarsi). Sono disponibili altri modi per emarginare i coefficienti di regressione quantile come il metodo di Firpo (2009) usando la funzione influenza recente. Il libro di Angrist e Pischke (2009) menzionato nei commenti afferma che l'emarginazione dei coefficienti di regressione quantile è ancora un campo di ricerca attivo in econometria, sebbene per quanto ne sappia la maggior parte delle persone al giorno d'oggi si accontentano del metodo di integrazione (un esempio sarebbe Melly e Santangelo (2015) che lo applicano al modello Cambi-in-cambiamenti).

3) I coefficienti di regressione quantile condizionale sono distorti? No (supponendo che tu abbia un modello correttamente specificato), misurano semplicemente qualcosa di diverso a cui potresti essere interessato o meno. Un effetto stimato su una distribuzione piuttosto che sugli individui è come ho detto non molto interessante - il più delle volte. Per fare un contro esempio: considerare un decisore politico che introduce un ulteriore anno di scuola dell'obbligo e vogliono sapere se ciò riduce la disparità di guadagno nella popolazione.

I primi due pannelli mostrano un puro spostamento di posizione in cui è una costante in tutti i quantili, vale a dire un costante effetto di trattamento quantile, il che significa che se , un anno aggiuntivo dell'istruzione aumenta gli utili dell'8% nell'intera distribuzione degli utili.βτβ10=β90=0.8

Quando l'effetto del trattamento quantile NON è costante (come nei due pannelli inferiori), si ha anche un effetto scala oltre all'effetto posizione. In questo esempio la parte inferiore della distribuzione degli utili si sposta di più della parte superiore, quindi il differenziale 90-10 (una misura standard della disuguaglianza degli utili) diminuisce nella popolazione. inserisci qui la descrizione dell'immagine

Non sai quali individui ne traggono beneficio o in quale parte della distribuzione sono le persone che hanno iniziato in fondo (per rispondere a QUESTA domanda hai bisogno dei coefficienti di regressione quantistica incondizionata). Forse questa politica li danneggia e li mette in una parte ancora più bassa rispetto agli altri, ma se l'obiettivo era sapere se un ulteriore anno di istruzione obbligatoria riduce la diffusione dei guadagni, questo è informativo. Un esempio di tale approccio è Brunello et al. (2009) .

Se siete ancora interessati al bias delle regressioni quantili dovute a fonti di endogeneità, date un'occhiata a Angrist et al (2006), dove derivano una formula di bias variabile omessa per il contesto quantile.


1
Esiste attualmente un'implementazione R di questa tecnica?
chandler,

1

Oltre all'ottima risposta fornita da @Andy. Potresti voler dare un'occhiata:

Borah, BJ e Basu, A. (2013). "Evidenziando le differenze tra gli approcci di regressione quantile condizionale e incondizionata attraverso un'applicazione per valutare l'aderenza ai farmaci." Health Economics, 22 (9), 1052-1070. http://doi.org/10.1002/hec.2927

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.