Previsione di serie temporali di Arima (auto.arima) con più variabili esogene in R


14

Vorrei condurre una previsione basata su un modello ARIMA di serie temporali multiple con più variabili esogene. Dal momento che non sono così abile per quanto riguarda né le statistiche né il RI che voglio mantenere è il più semplice possibile (è sufficiente una previsione del trend per 3 mesi).

Ho 1 serie storiche dipendenti e 3-5 serie temporali predittive, tutti i dati mensili, nessuna lacuna, stesso "orizzonte" temporale.

Ho incontrato la funzione auto.arima e mi sono chiesto se questa sarebbe stata una soluzione adatta al mio problema. Ho diversi prezzi delle materie prime e prezzi dei prodotti realizzati da loro. Tutti i dati grezzi sono non stazionari ma, mediante la differenziazione del primo ordine, diventano tutti dati stazionari. ADF, KPSS indicano questo. (Ciò significa che ho testato l'integrazione, giusto?).

La mia domanda ora è: come posso applicarlo con la funzione auto.arima E ARIMA è comunque l'approccio giusto? Alcuni ppl mi hanno già consigliato di utilizzare VAR, ma è possibile anche con ARIMA?

La seguente tabella contiene i miei dati. In realtà il set di dati sale fino a 105 osservazioni, ma i primi 50 lo faranno. La tendenza e la stagionalità sono ovviamente di interesse qui.

inserisci qui la descrizione dell'immagine

Grazie per eventuali consigli e aiuto! Georg


pubblica i tuoi dati in modo che possano essere scaricati. usa Excel. Questo potrebbe semplicemente essere un compito per identificare serie di input non necessarie (forse significativamente correlate tra loro). Non credo che VAR sia necessario o Principle Components utile per questo problema
IrishStat

Risposte:


10

Se i regressori esterni sono causale per , ma non il contrario e non causano l'un l'altro, poi ARIMA è sicuramente appropriata. VAR ha senso se le diverse serie temporali dipendono tutte l'una dall'altra.y

Per auto.arima()lavorare con i regressori esterni, raccogliere i regressori in una matrice X, di cui si inserisce il xregparametro auto.arima(). (Naturalmente, Xdeve avere lo stesso numero di righe delle serie temporali yche stai modellando.)

Per la previsione, avrai bisogno dei valori futuri dei tuoi regressori, di cui successivamente inserirai nuovamente il xregparametro forecast.

Le pagine di aiuto sono ?auto.arimae ?forecast.Arima(notare la A maiuscola - questo non è un errore di battitura. Non chiedermelo ...).


1
(+1) Potresti approfondire un po 'l'idea della causalità e come testarla. Può essere utile per completezza della tua risposta, poiché dici che la decisione di usare ARIMA è determinata dalla direzione della causalità tra le variabili. Ad esempio, stai pensando al test di causalità di Granger o al test di Hausman ? Grazie.
javlacalle,

3
@javlacalle: non sono un grande fan dei test statistici per la causalità (di cui il test Granger è il più noto). Preferisco di gran lunga decidere sulla "probabile causalità" in base all'argomento. Ad esempio, non vorrei utilizzare un test Granger per valutare se una riduzione del prezzo aumenta le vendite del supermercato o viceversa. Né se il PIL, i tassi di cambio e la creazione di posti di lavoro siano reciprocamente causali. In entrambi i casi la questione appare abbastanza ovvia e un test in linea con la teoria non ci insegnerà nulla, mentre un test in contraddizione con la teoria sarà solo fonte di confusione (e probabilmente non più del rumore).
Stephan Kolassa,

1
... so che mi sto aprendo alle fiamme con il mio ultimo commento ;-)
Stephan Kolassa,

@ Stephan: grazie per il tuo contributo. Sebbene il mio y sia definitivamente causato dai miei regressori e non viceversa, ma i miei regressori sono definitivamente correlati tra loro e dovrebbero anche avere impatti più o meno diretti l'uno sull'altro. Secondo il tuo commento, questo significa che dovrei usare VAR invece di arima, poiché questo eviterà problemi (?). Sto usando un insieme di prezzi di prodotti / merci qui, che praticamente tutti sono correlati tra loro fino a un certo punto. La "materia prima" è la mia Y, i miei predittori sono i prodotti della catena del valore, nonché i prodotti collaterali ecc.
George,

1
Conoscere il contesto dei dati è sempre utile e i risultati di qualsiasi analisi devono essere confrontati con le nostre conoscenze a priori . Si consiglia comunque una certa cautela. L'intuizione a volte fallisce e le teorie a volte date per scontate si basano su ipotesi che non sono supportate dai fatti. Ma capisco cosa intendi e sono d'accordo nel complesso.
javlacalle,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.