Regressione delle serie temporali con dati sovrapposti


13

Sto vedendo un modello di regressione che sta regredendo i rendimenti dell'indice azionario su base annua su ritardati (12 mesi) rendimenti su base annua dello stesso indice azionario, spread creditizio (differenza tra media mensile di obbligazioni senza rischio e obbligazioni societarie rendimenti), tasso di inflazione su base annua e indice su base annua di produzione industriale.

Sembra così (anche se in questo caso avresti sostituito i dati specifici dell'India):

SP500YOY(T) = a + b1*SP500YOY(T-12) + b2*CREDITSPREAD(T) +    
b4*INDUSTRIALPRODUCTION(T+2) + b3*INFLATION(T+2) + b4*INFLATIONASYMM(T+2)

SP500YOY è i rendimenti anno su anno per l'indice SP500 Per calcolare questo, viene calcolata la media mensile dei valori SP500 e quindi convertiti in rendimenti anno per anno per ogni mese (ad es. Jan'10-Jan'11, Feb'10- Feb'11, Mar'10-Mar'11,..). Sul lato delle variabili esplicative, viene utilizzato un valore ritardato di 12 mesi di SP500YOY insieme a CREDITSPREAD al momento T e INFLATION e INDUSTRIALPRODUCTION a due periodi AHEAD. INFLATIONASYMM è un manichino per stabilire se l'inflazione è al di sopra di un valore soglia del 5,0%. L'indice tra parentesi mostra l'indice temporale per ciascuna variabile.

Questo è stimato dalla regressione lineare standard OLS. Per utilizzare questo modello per prevedere i rendimenti YOY di SP500 di 1,2 e 3 mesi in anticipo, è necessario generare previsioni anticipate di 3,4 e 5 mesi per l'inflazione e l'indice di produzione industriale. Queste previsioni vengono fatte dopo aver adattato un modello ARIMA a ciascuno dei due individualmente. Le previsioni di CreditSpread per 1,2 e 3 mesi in anticipo vengono semplicemente inserite come stime mentali.

Vorrei sapere se questa regressione lineare OLS è una pratica statistica corretta / errata, efficiente / inefficiente o generalmente valida.

Il primo problema che vedo è quello dell'utilizzo di dati sovrapposti. vale a dire che i valori giornalieri dell'indice azionario vengono calcolati in media ogni mese e quindi utilizzati per calcolare i rendimenti annuali che vengono rinnovati mensilmente. Questo dovrebbe rendere il termine di errore autocorrelato. Penserei che si dovrebbe usare un po 'di "correzione" sulle linee di uno dei seguenti:

  • Stimatore di covarianza coerente dell'eteroscedasticità di White
  • Stimatore di eteroscedasticità e coerenza di autocorrelazione (HAC) di Newey & West
  • versione coerente con l'eteroscedasticità di Hansen & Hodrick

Ha davvero senso applicare la regressione lineare OLS standard (senza correzioni) a tali dati sovrapposti, e ancora di più, utilizzare le previsioni ARIMA anticipate a 3 periodi per le variabili esplicative da utilizzare nella regressione lineare OLS originale per la previsione SP500YOY? Non ho mai visto una tale forma prima d'ora, e quindi non posso davvero giudicarla, senza l'eccezione della correzione per l'uso di osservazioni sovrapposte.


Per favore, non fare il cross-post .
Joshua Ulrich,

Risposte:


10

1
Da questi documenti non è molto chiaro come applicare queste correzioni nella pratica. C'è una procedura più pratica o un tutorial da qualche parte?
risciacquo

@rinspy Vedi quant.stackexchange.com/questions/35216/… per qualche codice su Hansen & Hodrick
Candamir,

5
Potete fornire un riepilogo delle informazioni contenute in questi articoli e come forniscono una soluzione alla domanda?
gung - Ripristina Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.