Non non c'è bisogno ipotesi il 4 momenti di consistenza del OLS stimatore, ma si fa ipotesi sulle necessità più alti momenti di e ε di normalità asintotica e per stimare costantemente ciò che la matrice di covarianza asintotica è.Xε
In un certo senso però, questo è un punto matematico, tecnico, non pratico. Perché OLS funzioni bene in campioni finiti in un certo senso richiede più dei presupposti minimi necessari per ottenere consistenza asintotica o normalità come .n → ∞
Condizioni sufficienti per coerenza:
Se hai un'equazione di regressione:
yio= x'ioβ + ϵio
Lo stimatore OLS può essere scritto come:
b =β+( X ' XB^
B^= β + ( X'Xn)-1(X'εn)
Per coerenza , devi essere in grado di applicare la Legge dei grandi numeri di Kolmogorov o, nel caso di serie temporali con dipendenza seriale, qualcosa come il Teorema Ergodico di Karlin e Taylor in modo che:
1nX'X→pE [ xioX'io]1nX'ϵ →pE [ x'ioεio]
Altre ipotesi necessarie sono:
- E [ xioX'io] il grado completo e quindi la matrice è invertibile.
- I regressori sono predeterminati o rigorosamente esogeni in modo che .E [ xioεio] = 0
Quindi e ottieni(X'Xn)- 1(X'εn) →p0B^→pβ
Se vuoi applicare il teorema del limite centrale, allora hai bisogno di ipotesi sui momenti più elevati, ad esempio dove . Il teorema del limite centrale è ciò che ti dà la normalità asintotica di e ti permette di parlare di errori standard. Perché esista il secondo momento , sono necessari i 4i momenti di e . Vuoi sostenere che doveg i = x i ε i b E [ g i gE [ giog'io]gio= xioεioB^xε√E [ giog'io]XεΣ=E[xix ′ i ϵ 2 i ]n−−√(1n∑ix′iϵi)→dN(0,Σ)Σ=E[xix′iϵ2i] . Perché questo funzioni, deve essere finito.Σ
Una bella discussione (che ha motivato questo post) è contenuta in Econometrics di Hayashi . (Vedi anche p. 149 per i 4i momenti e stima della matrice di covarianza.)
Discussione:
Questi requisiti al 4 ° momento sono probabilmente un punto tecnico piuttosto che un punto pratico. Probabilmente non incontrerai distribuzioni patologiche in cui questo è un problema nei dati di tutti i giorni? È per più comuni o altri presupposti di OLS andare storto.
Una domanda diversa, senza dubbio risposta altrove su Stackexchange, è quanto è grande un campione necessario per i campioni finiti per avvicinarsi ai risultati asintotici. C'è un senso in cui fantastici valori anomali portano a una convergenza lenta. Ad esempio, prova a stimare la media di una distribuzione lognormale con varianza davvero elevata. La media del campione è uno stimatore coerente e imparziale della media della popolazione, ma in quel caso log-normale con eccessiva curtosi ecc.
Il finito contro l'infinito è una distinzione estremamente importante in matematica. Non è questo il problema che incontri nelle statistiche quotidiane. I problemi pratici sono più nella categoria piccola vs. grande. La varianza, la curtosi, ecc ... sono abbastanza piccole da poter ottenere stime ragionevoli date le dimensioni del mio campione?
Esempio patologico in cui lo stimatore OLS è coerente ma non asintoticamente normale
Prendere in considerazione:
x i ~ N ( 0 , 1 ) ε i V a r ( ε i ) = ∞ b
yi=bxi+ϵi
Dove ma è tratto da una distribuzione t con 2 gradi di libertà, quindi . La stima OLS converge probabilmente in ma la distribuzione del campione per la stima OLS non è normalmente distribuita. Di seguito è riportata la distribuzione empirica per basata su 10000 simulazioni di una regressione con 10000 osservazioni.
xi∼N(0,1)ϵiVar(ϵi)=∞bb^b^
La distribuzione di non è normale, le code sono troppo pesanti. Ma se aumenti i gradi di libertà a 3 in modo che esista il secondo momento di , si applica il limite centrale e ottieni:
εib^ϵi
Codice per generarlo:
beta = [-4; 3.7];
n = 1e5;
n_sim = 10000;
for s=1:n_sim
X = [ones(n, 1), randn(n, 1)];
u = trnd(2,n,1) / 100;
y = X * beta + u;
b(:,s) = X \ y;
end
b = b';
qqplot(b(:,2));