predire


7

Il mio modello stimato è

ln^(yt)=9.8730.472ln(xt2)0.01xt3

Mi viene chiesto di trovare un IC predittivo con una sicurezza del 95% per la media di y0, quando x02=250, e x03=8. Lo supponiamos2x0(XTX)1x0T=0.000243952, dove x0=(250,8).

Ho una soluzione di un anno precedente, che va così:

Trovo il CI del modulo CI(E[ln(y0)|x0])=[ln^(yt)tα/2sE,ln^(yt)+tα/2sE], dove t è il α/2 quantile superiore della distribuzione t(nk) e sE=0.000243952. Questo mi dà[7.1563,7.2175].

Quindi l'autore lo fa CI(E[y0|x0])=[e7.1563,e7.2175]=[1282.158,1363.077].

Non sono d'accordo con quest'ultimo passaggio (per disuguaglianza di Jensen lo sottovaluteremo). In Intro to Econometrics di Wooldridge, a pagina 212, afferma che se siamo sicuri che i termini di errore sono normali, uno stimatore coerente è:

E^[y0|x0]=es2/2eln^(y0)

Quindi stavo pensando di farlo

CI(E[y0|x0])=[es2/21282.158,es2/21363.077]=[1282.314,1363.243]

È corretto?

Inoltre, la soluzione a questo esercizio afferma che CI(E[y0|x0])=[624.020,663.519], che è tutt'altro che una soluzione che ho.

Qualsiasi aiuto sarebbe apprezzato.

PS: ho anche letto che la correzione non dovrebbe essere utilizzata per l'IC ma solo per la stima puntuale E^[y0|x0]

Risposte:


3

Non trovi la stessa risposta a causa di quello che sospetto sia un errore tipografico, che sarebbe quindi la ragione principale del tuo problema: x03 sarebbe impostato su 80no 8. Un'altra possibilità, se continuix03=8, è un errore nel secondo coefficiente stimato, ad esempio, β^2=0.1 invece di 0.01.

Comunque, una di queste modifiche risolve tutto e produce lo stesso risultato della soluzione a questo esercizio.

Considerando questo cambiamento, con tα/2=1.96476138969835, uno ottiene

Metodo 1

CI(E[y0|x0])=[e6.43618291164626,e6.49755798189177]=[624.020307335178,663.519326788772] (la soluzione data a questo esercizio)

o

Metodo 2

(come affermato nell'Introduzione all'econometria di Wooldridge, a pagina 212) se siamo sicuri che i termini di errore sono normali (e uno è estremamente fortunato)

CI(E[y0|x0])=[es2/2624.0203,es2/2663.5193]=[624.0960,663.6002]

però

è improbabile che il metodo 2 sia corretto, poiché, come menzionato nella domanda, [...] la correzione (sottostimata) non dovrebbe essere utilizzata per l'IC ma solo per la stima puntuale.

Perché ? Direi a causa della dipendenza tra i due termini, conoscendo le aspettative dies2/2 da un lato e y0^ d'altra parte non significa che si conosca quello di es22+ln(y0)^.


2

La previsione dei punti e CI sono diversi.

Per la previsione puntuale, stiamo meglio correggendo il bias il più possibile. Per CI, ciò che è richiesto dall'inizio è che la probabilità sia uguale100(1α)%. quando[a,b] è il 95% CI per ln(y0) per esempio, [ea,eb] è certamente un IC al 95% per y0 perché P(alnXb)=P(eaXeb). Quindi il tuo[e7.1563,e7.2175] è certamente un elemento della configurazione valido.

Ma il centro di questo CI non è né l'ingenuo predittore (exp [predittore di lny0]) né il predittore corretto di y0(un fattore di correzione moltiplicato per l'ingenuo predittore) a causa della disuguaglianza di Jensen, ma non importa. In alcuni casi (non sempre), potresti essere in grado di modificare l'elemento della configurazione[eap,ebq] per alcuni p e q quindi la probabilità è ancora del 95% e il suo centro è il predittore corretto dal bias, ma non ne vedo il punto.

Quello che hai suggerito, cioè [es2/2ea,es2/2eb]non è un IC al 95%. Per capire perché, lascia che sia il fattore di correzioneh (non casuale e perfettamente noto, per semplicità), quindi è il predittore corretto dal bias heθ, dove θ è il predittore imparziale di lny0 (β^0+β^2lnx2+β^3x3nel tuo esempio). Questo "h"può essere stimato da es2/2 per esempio, ma mentre quest'ultimo è casuale, hè considerato non casuale al fine di renderlo semplice. Permettere[a,b] essere il 95% CI per lny0cioè P(alny0b)=0.95. Poi,

P(heay0heb)=P(lnh+alny0lnh+b),
che non è uguale aP(alny0b)=0.95 a meno che la distribuzione di lny0 è uniforme, che di solito non lo è.

MODIFICARE

Quanto sopra riguarda l'IC di y0, non di E(y|X=x0). La domanda originale riguarda l'IC perE(y|X=x0). PermettereE(y|X=x0)=hexp(x0β), che è stimato da h^exp(x0β^). In tal caso, penso che il metodo Delta sia un'opzione utile (vedi la risposta di luchonacho).

Per essere rigorosi, abbiamo bisogno della distribuzione congiunta di h^ e β^o, per essere precisi, la distribuzione asintotica del vettore n[(β^β),h^h]. Quindi la distribuzione limite din[h^exp(x0β^)hexp(x0β)] è derivato usando il metodo Delta e quindi CI per hexp(x0β) può essere costruito.


Grazie per la risposta Chan. A proposito, in questo esercizio, lo stimatore dei punti per entrambiy0 o E(y|X0)è uguale. La stima risultante è al di fuori dell'IC perE(y|X0) ma all'interno dell'IC per y0. Non dovrebbero essere entrambi nel loro CI?
Un vecchio nel mare.

Sì, aiuta. Potresti controllare questa mia domanda. È legato a questo. economics.stackexchange.com/questions/16891/…
Un vecchio nel mare.

In un commento che ho fatto ed eliminato, ho fatto un errore. E(y|X=x0) è ovviamente diverso da exp{E(logy|X=x0)}come afferma la risposta di Alecos Papadopoulos alla tua domanda. Mille grazie @Anoldmaninthesea, e mi dispiace per quello. Forse lo stavo pensandoexp(x0β^) è sufficientemente vicino a exp(x0β), che non è quello che hai sollevato. Hmm, in quel caso la tua osservazione è ancora più interessante.
chan1142,

1
Non ho mai pensato a questo problema. Lo farò ora. Quindi si tratta dell'IC perE(y|X=x0). Il metodo Delta spiegato da luchonacho sembra utile in questo caso. Grazie @Anoldmaninthesea per averlo sollevato.
chan1142,

Chan, ho collegato un'altra mia domanda a questa. Lì troverai una risposta che ho scritto che potresti trovare interessante.
Un vecchio nel mare.

1

Usa il metodo Delta . Pronuncia la distribuzione asintotica di grandi campioni di un singolo parametroβ è:

β^aN(β,Var(β^)n)

(supponendo che la tua stima sia coerente)

Inoltre, sei interessato a una funzione di β^diciamo F(β^). Quindi, un'approssimazione di Taylor del primo ordine di quanto sopra porta alla seguente distribuzione asintotica:

F(β^)aN(F(β),(F(β^)β^)2Var(β^)n)

Nel tuo caso, F(β^) è eβ^. Da qui, puoi costruire l'IC come di consueto.

Fonte e maggiori dettagli nel documento collegato.


lucho, non posso usare il metodo Delta per questo ... ma grazie comunque. ;)
Un vecchio nel mare.

: o perché no? Qualche ipotesi che ho letto male o non dichiarato?
luchonacho,

1
Non è solo il punto dell'esercizio. Sono davvero interessato a sapere quale metodo è corretto. Inoltre, il tuo metodo fornisce una distribuzione approssimativa, mentre nell'esercizio vogliono un CI preciso.
Un vecchio nel mare.
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.