Come posso incorporare un valore anomalo innovativo all'osservazione 48 nel mio modello ARIMA?


10

Sto lavorando su un set di dati. Dopo aver usato alcune tecniche di identificazione del modello, sono uscito con un modello ARIMA (0,2,1).

Ho usato la detectIOfunzione nel pacchetto TSAin R per rilevare un valore anomalo innovativo (IO) alla 48a osservazione del mio set di dati originale.

Come posso incorporare questo valore anomalo nel mio modello in modo da poterlo utilizzare a fini di previsione? Non voglio usare il modello ARIMAX poiché potrei non essere in grado di fare previsioni da quella in R. Esistono altri modi per farlo?

Ecco i miei valori in ordine:

VALUE <- scan()
  4.6  4.5  4.4  4.5  4.4  4.6  4.7  4.6  4.7  4.7  4.7  5.0  5.0  4.9  5.1  5.0  5.4
  5.6  5.8  6.1  6.1  6.5  6.8  7.3  7.8  8.3  8.7  9.0  9.4  9.5  9.5  9.6  9.8 10.0
  9.9  9.9  9.8  9.8  9.9  9.9  9.6  9.4  9.5  9.5  9.5  9.5  9.8  9.3  9.1  9.0  8.9
  9.0  9.0  9.1  9.0  9.0  9.0  8.9  8.6  8.5  8.3  8.3  8.2  8.1  8.2  8.2  8.2  8.1
  7.8  7.9  7.8  7.8

In realtà sono i miei dati. Sono tassi di disoccupazione per un periodo di 6 anni. Vi sono quindi 72 osservazioni. Ogni valore è al massimo di un decimale


6
Puoi creare un manichino che è 1 per e 0 in tutti gli altri periodi. Quindi rivalutare il modello. Ciò impedirà a questo anomalo di distorcere le previsioni. Se non è quello che hai in mente, dovresti approfondire il secondo paragrafo. t=48
Dimitriy V. Masterov,

2
@Gen_b Hai ragione, dovrebbe disturbarti poiché questo è probabilmente troppo differenziato producendo un MA di annullamento (1). L'identificazione errata deriva dall'uso di strumenti inappropriati.
IrishStat,

2
Nelle seconde differenze, hai quello che sembra un outlier, ma apparentemente è causato da un piccolo salto additivo all'osservazione 47 della serie originale, che quando differenzia due volte sembra un grande outlier negativo un periodo dopo. Se fai qualcosa di semplice per rimuovere quel piccolo effetto all'osservazione 47 (quasi tutto ciò che è sensato), nella seconda differenza non appaiono valori anomali. Direi che forse è meglio guardare come un AO sulla scala originale.
Glen_b -Restate Monica il

2
C'è molto da fare in questo set di dati, ma il comportamento temporale locale (correlazione, stagionalità, ecc.) È il minimo. Quando analizzi ciecamente dati come questo solo come una sequenza di numeri, sei a rischio di produrre risultati ridicoli (o peggio). Cosa puoi dirci sul significato di questi dati ? Sono forse misurazioni di qualcosa in una stazione di monitoraggio? Una serie temporale economica? Un grafico di crescita biologica? Comprendere qualcosa sul fenomeno di base di solito farà molto di più per aiutare a identificare un modello di qualsiasi altra manipolazione del software statistico.
whuber

2
@whuber: sono i tassi di disoccupazione per un periodo di 6 anni!
b2amen,

Risposte:


3

Y(t)=[θ/φ][UN(t)+IO(t)]Y*(t)=[θ/φ][UN(t)]+[θ/φ][IO(t)]

θ=1φ=[1-.5B]
Y*(t)=[1/(1-.5B)][UN(t)]
+IO(t)-.5IO(t-1)+.25IO(t-2)-.125IO(t-3)-....


Y*(t)=[1/(1-.5B)][UN(t)] +10IO(t)-5IO(t-1)+2.5IO(t-2)-1.25IO(t-3)-....
IO

In questo modo puoi vedere che l'impatto dell'anomalia non è solo istantaneo ma ha memoria.

t

[w(B)/d(B)][w(B)]

Ogni volta che si incorpora la memoria, che sia il risultato di un operatore di differenziazione o di una struttura ARMA, si tratta di una tacita ammissione dell'ignoranza dovuta a omesse serie causali. Ciò vale anche per la necessità di incorporare serie deterministiche di intervento come Impulsi / Spostamenti di livello, Impulsi stagionali o Andamenti dell'ora locale. Queste variabili fittizie sono un proxy necessario per le variabili causali determinate dall'utente deterministiche omesse. Spesso tutto ciò che hai è la serie di interessi e dati i qualificatori che ho enunciato, puoi prevedere il futuro in base al passato in totale ignoranza esattamente della natura dei dati analizzati. L'unico problema è che stai usando il lunotto per prevedere la strada da percorrere ... una cosa davvero pericolosa.

dopo che i dati sono stati pubblicati ...

Un modello ragionevole è un (1,1,0) inserisci qui la descrizione dell'immaginee le anomalie AO sono state identificate nei periodi 39,41,47,21 e 69 (non nel periodo 48). I residui di questo modello sembrano essere privi di struttura evidente. inserisci qui la descrizione dell'immagineE inserisci qui la descrizione dell'immagineLa fata AO valorizza una rappresentazione ottimale dell'attività riflessa dall'attività non nella storia delle serie temporali. Penserei che l'ACF del modello sovra-differenziato del PO rifletterebbe l'inadeguatezza del modello. Ecco il modello. inserisci qui la descrizione dell'immagine Ancora una volta non viene consegnato alcun codice R poiché il problema o l'opportunità è nel regno dell'identificazione / revisione / convalida del modello. Finalmente un diagramma della serie attuale / adattata e prevista.! [Inserire la descrizione dell'immagine qui] [6]


1
grazie per la tua risposta; ma in realtà volevo un codice R invece per il mio modello.
b2amen

1
@ b2amen Sì, ho sottovalutato MA Glen_b voleva delle "cose" e ho pensato di rispondergli.
IrishStat,

Grazie per il montaggio. Tu e io faremmo buoni partner!
IrishStat,

@ IrishStat: i miei dati sono inclusi nella domanda originale. Spero che possa aiutarti ad aiutarmi. Grazie comunque
b2amen,

@IrishStat: mi piace il tuo output. Mi sembra abbastanza pulito. E quale software hai usato? Ma potresti spiegare come hai identificato un AR (2,1,0)? Grazie
b2amen il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.