Attualmente sto lavorando a un progetto per fare previsioni sui dati di una serie temporale (dati mensili). Sto usando R per fare le previsioni. Ho 1 variabile dipendente (y) e 3 variabili indipendenti (x1, x2, x3). La variabile y ha 73 osservazioni, così come le altre 3 variabili (alos 73). Da gennaio 2009 a gennaio 2015. Ho verificato le correlazioni e il valore p, ed è tutto significativo metterlo in un modello. La mia domanda è: come posso fare una buona previsione usando tutte le variabili indipendenti? Non ho valori futuri per queste variabili. Diciamo che vorrei prevedere quale sia la mia variabile y in oltre 2 anni (nel 2017). Come posso fare questo?
Ho provato il seguente codice:
model = arima(y, order(0,2,0), xreg = externaldata)
Posso fare una previsione del valore y per 2 anni con questo codice?
Ho anche provato un codice di regressione:
reg = lm(y ~ x1 + x2 + x3)
Ma come posso dedicare del tempo a questo codice? Come posso prevedere quale sarà il mio valore y, diciamo 2 anni? Sono nuovo di statistiche e previsioni. Ho fatto alcune letture e cam sul valore di ritardo, ma come posso usare un valore di ritardo nel modello per fare previsioni?
In realtà la mia domanda generale è come posso prevedere i dati di una serie temporale con variabili esterne senza valore futuro?