Considera il seguente modello di regressione multipla:
Qui è un vettore di colonna ; Matrice a ; a colonna vettore; a matrice; a colonna vettore; e , il termine di errore, un vettore di colonna .
DOMANDA
Il mio docente, il libro di testo Introduzione all'econometria, 3a ed. di James H. Stock e Mark W. Watson, pag. 281, ed Econometrics: Honor's Exam Review Session (PDF) , p. 7, mi ha espresso quanto segue.
- Se assumiamo ciò che viene chiamato condizionale significa indipendenza , che per definizione significa che
e se il presupposto dei minimi quadrati è soddisfatto eccetto il presupposto zero della media condizionale (quindi assumiamo ) (vedi 1 -3 sotto),
quindi, lo stimatore OLS di in rimane imparziale e coerente, sotto questo insieme più debole di ipotesi.
Come posso dimostrare questa proposta? Vale a dire, che 1 e 2 sopra implicano che la stima OLS di ci fornisce uno stimatore imparziale e coerente per ? C'è qualche articolo di ricerca che prova questa proposta?
COMMENTO
Il caso più semplice è dato considerando il modello di regressione lineare e dimostra che la stima OLS di è imparziale se per ciascuno .
LA PROVA DI UNBIASEDNESS ASSUNZIONANDO CHE E SONO DISTRIBUITI NORMALMENTE NORMALMENTE
Definisci , quindi edPertanto può essere riscritto come Di segue quindi che Ora, poiché e sono distribuiti congiuntamente normalmente, la teoria delle distribuzioni normali, cfr. Derivare le distribuzioni condizionali di una distribuzione normale multivariata , afferma che (in effetti, non è necessario assumere la normalità congiunta ma solo questa identità) per alcuni di vettore
Ora diventa Per il modello tutti i presupposti dei minimi quadrati sono soddisfatti, poiché il termine di errore soddisfa il presupposto del condizionale significa zero. Ciò implica che la stima OLS di sarà imparziale, poiché se lasciamo e lasciamo essere la di matrice composta da e , quindi la stima OLS di in è data considerando quanto segue:
e quindi dove la seconda riga segue per . Pertanto è una stima condizionale imparziale di poiché la stima OLS fornita per i modelli coinicidi con quella fornita per il modello . Ora, secondo la legge dell'aspettativa totale e quindi è uno stimatore imparziale per .
(Si può notare che , quindi il coefficiente su non è necessariamente imparziale.)
Tuttavia, il caso speciale sopra presuppone che e siano distribuiti congiuntamente normalmente, come posso dimostrare la proposta senza questo presupposto?
Supponendo che sempre ovviamente ovvio (cfr. ), ma dovrei derivare il risultato semplicemente usando e l'assunzione dei minimi quadrati escludendo l'assunzione Zero medio condizionale ( vedi sotto).
PER QUANTO RIGUARDA LA COERENZA
Penso che si possa anche vedere che la stima è coerente per notando che nel modello di regressione tutti i presupposti dei minimi quadrati sono soddisfatti, incluso il presupposto che il (nuovo) termine di errore soddisfi il Presupposto zero medio condizionale (cfr. E vedi sotto).
Potrei aggiungere una prova di coerenza in seguito, sulla base di una serie di esercizi in Introduzione all'econometria, 3a ed. di James H. Stock e Mark W. Watson, cap. 18. Tuttavia, questa prova è piuttosto lunga. Ma il punto qui è che la prova fornita negli esercizi presuppone , quindi mi sto ancora chiedendo se il presupposto davvero sufficiente.
SOTTOTERIA 1
In Introduction to Econometrics, 3a ed. di James H. Stock e Mark W. Watson, si dice, a pag. 300, che il presupposto può essere "rilassato" usando la teoria della regressione non lineare. Che cosa significano o possono significare con questo?
LE ULTIME ASSUNZIONI SQUADRATE
Qui escludo l'assunzione zero media condizionale che poiché la proposizione che proviamo a dimostrare qui consente i casi in cui . Questi sono casi ad esempio quando è correlata con . Cf. Econometrics: Honor's Exam Review Session (PDF) , p. 7.
I presupposti dei minimi quadrati sono i seguenti.
Le distribuzioni congiunte di , sono iid, dove è l' elemento : th in e dove e sono : vettori di riga in e .
Grandi valori anomali sono improbabili, cioè per ogni , e hanno momenti quarti finiti, dove è l' : esimo elemento a .
ha un rango di colonna completo (ovvero non esiste una multicollinearità perfetta; ciò garantisce l'invertibilità di ).
( Ipotesi sui minimi quadrati estesi : anche se non penso che ciò sia necessario (e mi è stato detto che non lo è), possiamo anche assumere l'omoschedasticità, cioè per ogni e che la distribuzione condizionale di fornita è normale per ogni (ovvero, abbiamo errori normali).
NOTA SULLA TERMINOLOGIA
In , il presupposto dello zero medio condizionale è il presupposto che . Il presupposto di indipendenza media condizionale, tuttavia, è il presupposto che .
Questa terminologia è utilizzata ad es. Introduzione all'econometria, 3a ed. di James H. Stock e Mark W. Watson, pag. 281; e analisi econometrica dei dati di sezioni trasversali e panel, 1a ed. di Jeffrey M. Wooldridge, pag. 607. Vedi anche Restrizioni condizionali all'indipendenza: test e stime per discussioni simili.
PENSIERI E SOTTOTERIA SUPPLEMENTARI 2
Penso contrariamente a James H. Stock e Mark W. Watson che l'indipendenza media condizionale non garantisca una stima OLS imparziale di . Questo perché può assumere forme non lineari come dove è un polinomio in o dove è un parametro ancora da stimare (qui sto usando la matrice esponenziale ), e quindi, penso, debba essere applicata una regressione non lineare , che generalmente ci lascia con stime distorte. Inoltre, la stima OLS in (1) di potrebbe non coincidere nemmeno con la stima OLS diin se assume determinate forme non lineari. (Psicologicamente sento anche che l'affermazione fatta nel libro di Stock & Watson è troppo bella per essere vera.)
Quindi, una domanda aggiuntiva è se esiste qualche controesempio alla proposizione che l'indipendenza media condizionale porta a una stima OLS imparziale?
SOTTOTERIA 3
In Mostly Harmless Econometrics Angrist & Pischke discute nella sottosezione 3.3, pag. 68--91, che sotto l'indipendenza condizionale (CI), cioè essendo indipendente da dato (che è una condizione più forte, suppongo, rispetto al presupposto di indipendenza media condizionale dato sopra), c'è una stretta connessione tra stime corrispondenti di l'effetto di su e i coefficienti su nella regressione di su e che motiva che sotto CI la stima OLS del coefficiente su in è meno distorto rispetto a se CI non regge (tutto il resto uguale).
Ora, questa idea può in qualche modo essere usata per rispondere alla mia domanda principale qui?