Alcuni avvertimenti prima di procedere. Come spesso suggerisco ai miei studenti, usare le auto.arima()
cose solo come prima approssimazione al risultato finale o se si desidera avere un modello parsimonioso quando si verifica che il modello basato sulla teoria rivale faccia meglio.
Dati
Devi chiaramente iniziare dalla descrizione dei dati delle serie temporali con cui stai lavorando. Nella macroeconometria di solito si lavora con dati aggregati e i mezzi geometrici (sorprendentemente) hanno prove empiriche più significative per i dati di serie temporali macro, probabilmente perché la maggior parte di essi è scomponibile in una tendenza in crescita esponenziale .
A proposito, il suggerimento di Rob "funziona visivamente" per le serie temporali con una chiara parte stagionale , poiché i dati annuali che variano lentamente sono meno chiari per gli aumenti delle variazioni. Per fortuna si osserva di solito una tendenza in crescita esponenziale (se sembra essere lineare, quindi non c'è bisogno di log).
Modello
Y( t ) = Xα11( t ) . . . XαKK( t ) ε ( t )
Nei registri di econometria finanziaria sono una cosa comune a causa della popolarità dei ritorni di registro, perché ...
Le trasformazioni dei log hanno proprietà interessanti
αioY( t )Xio( t )
Nei modelli di correzione degli errori abbiamo un'ipotesi empiricamente più forte che le proporzioni siano più stabili ( stazionarie ) delle differenze assolute.
In econometria finanziaria è facile aggregare i ritorni di registro nel tempo .
Ci sono molte altre ragioni non menzionate qui.
Finalmente
Si noti che la trasformazione del registro viene generalmente applicata alle variabili non negative (livello). Se si osservano le differenze di due serie temporali (ad esempio, l'esportazione netta) non è nemmeno possibile prendere il registro, è necessario cercare i dati originali nei livelli o assumere la forma di tendenza comune che è stata sottratta.
[ aggiunta dopo modifica ] Se si desidera ancora un criterio statistico per quando eseguire la trasformazione dei registri, una soluzione semplice sarebbe un test per l'eteroscedasticità. In caso di varianza crescente, consiglierei Goldfeld-Quandt Test o simile. In R si trova in library(lmtest)
ed è indicato dalla gqtest(y~1)
funzione. Se non hai alcun modello di regressione, regredisci semplicemente sul termine di intercettazione, y
è la tua variabile dipendente.