Quando effettuare il log trasformare una serie temporale prima di adattare un modello ARIMA


26

In precedenza ho usato la previsione pro per prevedere serie temporali univariate, ma sto passando il mio flusso di lavoro a R. Il pacchetto di previsione per R contiene molte funzioni utili, ma una cosa che non fa è qualsiasi tipo di trasformazione dei dati prima di eseguire auto .arima (). In alcuni casi, la previsione pro decide di registrare i dati di trasformazione prima di fare previsioni, ma non ho ancora capito perché.

Quindi la mia domanda è: quando dovrei trasformare i log delle mie serie storiche prima di provare i metodi ARIMA?

/ modifica: dopo aver letto le tue risposte, userò qualcosa del genere, dove x è la mia serie temporale:

library(lmtest)
if ((gqtest(x~1)$p.value < 0.10) {
    x<-log(x)
}

ha senso?

Risposte:


21

Alcuni avvertimenti prima di procedere. Come spesso suggerisco ai miei studenti, usare le auto.arima()cose solo come prima approssimazione al risultato finale o se si desidera avere un modello parsimonioso quando si verifica che il modello basato sulla teoria rivale faccia meglio.

Dati

Devi chiaramente iniziare dalla descrizione dei dati delle serie temporali con cui stai lavorando. Nella macroeconometria di solito si lavora con dati aggregati e i mezzi geometrici (sorprendentemente) hanno prove empiriche più significative per i dati di serie temporali macro, probabilmente perché la maggior parte di essi è scomponibile in una tendenza in crescita esponenziale .

A proposito, il suggerimento di Rob "funziona visivamente" per le serie temporali con una chiara parte stagionale , poiché i dati annuali che variano lentamente sono meno chiari per gli aumenti delle variazioni. Per fortuna si osserva di solito una tendenza in crescita esponenziale (se sembra essere lineare, quindi non c'è bisogno di log).

Modello

Y(t)=X1α1(t)...XKαK(t)ε(t)

Nei registri di econometria finanziaria sono una cosa comune a causa della popolarità dei ritorni di registro, perché ...

Le trasformazioni dei log hanno proprietà interessanti

αioY(t)Xio(t)

Nei modelli di correzione degli errori abbiamo un'ipotesi empiricamente più forte che le proporzioni siano più stabili ( stazionarie ) delle differenze assolute.

In econometria finanziaria è facile aggregare i ritorni di registro nel tempo .

Ci sono molte altre ragioni non menzionate qui.

Finalmente

Si noti che la trasformazione del registro viene generalmente applicata alle variabili non negative (livello). Se si osservano le differenze di due serie temporali (ad esempio, l'esportazione netta) non è nemmeno possibile prendere il registro, è necessario cercare i dati originali nei livelli o assumere la forma di tendenza comune che è stata sottratta.

[ aggiunta dopo modifica ] Se si desidera ancora un criterio statistico per quando eseguire la trasformazione dei registri, una soluzione semplice sarebbe un test per l'eteroscedasticità. In caso di varianza crescente, consiglierei Goldfeld-Quandt Test o simile. In R si trova in library(lmtest)ed è indicato dalla gqtest(y~1)funzione. Se non hai alcun modello di regressione, regredisci semplicemente sul termine di intercettazione, yè la tua variabile dipendente.


grazie per le informazioni. Con il test GQ, più basso è il valore p, più è probabile che la distribuzione sia eteroschedastica?
Zach,

@Zach: esattamente, prendi il 5% per esempio, ovviamente se non hai intenzione di andare per il data mining. Personalmente parto dalle ipotesi del modello.
Dmitrij Celov,

@Dmitrij. Grazie. Voglio solo assicurarmi di interpretare correttamente l'output.
Zach,

29

Traccia un grafico dei dati contro il tempo. Se sembra che la variazione aumenti con il livello della serie, prendi i log. Altrimenti modellare i dati originali.


3
Ecco una domanda: qual è l'effetto se prendi i registri e non sono richiesti? Mi è piaciuto quando si lavora con serie temporali che richiedono una trasformazione del registro, perché (come ho capito) i coefficienti sono rapporti e a valori piccoli quasi percentuali. (Ad esempio exp (0,05) = 1,051.)
Wayne,

4

Dai loro frutti li conoscerete

Il presupposto (da testare) è che gli errori del modello hanno una varianza costante. Nota che questo non significa gli errori di un modello presupposto. Quando si utilizza una semplice analisi grafica, si assume essenzialmente un modello lineare nel tempo.

Pertanto, se si dispone di un modello inadeguato come potrebbe essere suggerito da una trama casuale dei dati contro il tempo, si potrebbe concludere erroneamente sulla necessità di una trasformazione di potenza. Box e Jenkins lo hanno fatto con il loro esempio di dati aerei. Non hanno tenuto conto di 3 valori insoliti nei dati più recenti, quindi hanno erroneamente concluso che vi era una maggiore variazione nei residui al livello più alto della serie.

Per ulteriori informazioni su questo argomento, consultare http://www.autobox.com/pdfs/vegas_ibf_09a.pdf


1

Potresti voler trasformare le serie di log quando sono in qualche modo naturalmente geometriche o in cui il valore temporale di un investimento implica che ti confronterai con un'obbligazione a rischio minimo con un rendimento positivo. Ciò li renderà più "linearizzabili", e quindi adatti per una semplice relazione di ricorrenza differenziante.


1
Le trasformazioni sono come droghe: alcune sono buone per te e altre no. Se non sei interessato a testare l'ipotesi statistica, puoi assumere tutto quello che ti piace. I test parametrici di ipotesi hanno ipotesi sul prezzo dell'errore, ignorali a tuo rischio e pericolo.
IrishStat,

1
Così vero. Ho detto che il processo doveva essere geometrico. La mancata trasformazione può portare anche a errori di inferenza. Non vedo dove stavo suggerendo di ignorare le ipotesi relative alle condizioni di inferenza valida.
DWin

1
stats.stackexchange.com/questions/6498/… includeva una discussione su quando e perché trasformare. Il "fatto" che l'originale derivi sia "geometrico" non deduce che i residui di un modello adeguato abbiano una deviazione standard proporzionale alla media. Potrebbe, MA deve essere empiricamente provato o almeno testato.
IrishStat
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.