Cercherò di rispondere alla delicata sollecitazione di whuber di semplicemente "rispondere alla domanda" e rimanere in tema. Ci vengono fornite 144 letture mensili di una serie chiamata "The Airline Series". Box e Jenkins furono ampiamente criticati per aver fornito una previsione che era selvaggiamente positiva per via della "natura esplosiva" di una trasformazione inversa.
Visivamente abbiamo l'impressione che la varianza della serie originale aumenti con il livello della serie suggerendo la necessità di una trasformazione. Tuttavia sappiamo che uno dei requisiti per un modello utile è che la varianza degli "errori del modello" deve essere omogenea. Non sono necessarie ipotesi sulla varianza della serie originale. Sono identici se il modello è semplicemente una costante, ovvero y (t) = u. Come affermato da /stats//users/2392/probabilityislogic in modo così chiaro nella sua risposta ai consigli sulla spiegazione dell'eterogeneità / eteroscedasticità "una cosa che trovo sempre divertente è questa" non normalità dei dati "di cui le persone si preoccupano di. Non è necessario che i dati vengano distribuiti normalmente, ma il termine di errore no "
I primi lavori nelle serie temporali spesso passavano erroneamente alle conclusioni sulle trasformazioni ingiustificate. Scopriremo qui che la trasformazione correttiva di questi dati consiste semplicemente nell'aggiungere tre serie fittizie di indicatori al modello ARIMA che riflettono una regolazione per tre punti dati insoliti. Di seguito è riportato il diagramma della funzione di autocorrelazione che suggerisce una forte autocorrelazione al ritardo 12 (.76) e al ritardo 1 (.948). Le autocorrelazioni sono semplicemente coefficienti di regressione in un modello in cui y è la variabile dipendente prevista da un ritardo di y.
!
L'analisi sopra suggerisce che un modello modella le prime differenze della serie e studia quella "serie residua" che è identica prima alle prime differenze per le sue proprietà.
Questa analisi riconferma l'idea che esiste un forte modello stagionale nei dati che potrebbero essere corretti o modellati da un modello che conteneva due operatori diversi.
Questa semplice doppia differenziazione produce un insieme di residui, ovvero una serie regolata o parlando in modo approssimativo di una serie trasformata che evidenzia una varianza non costante ma il motivo della varianza non costante è la media non costante dei residui. serie doppiamente differenziate, suggerendo tre anomalie alla fine della serie. L'autocorrelazione di questa serie indica erroneamente che "tutto va bene" e potrebbe esserci la necessità di qualsiasi regolazione Ma (1). Si dovrebbe prestare attenzione in quanto vi è un suggerimento di anomalie nei dati, quindi l'acf è distorto verso il basso. Questo è noto come "Effetto Alice nel Paese delle Meraviglie", ovvero accettare l'ipotesi nulla di nessuna struttura evidente quando tale struttura viene mascherata da una violazione di una delle ipotesi.
Rileviamo visivamente tre punti insoliti (117.135.136)
Questo passaggio per rilevare i valori anomali si chiama Intervention Detection e può essere facilmente o meno programmato in seguito al lavoro di Tsay.
Se aggiungiamo tre indicatori al modello, otteniamo
Possiamo quindi stimare
E ricevi un diagramma dei residui e del acf
Questo acf suggerisce di aggiungere potenzialmente due coefficienti di media mobile al modello. Quindi il prossimo modello stimato potrebbe essere.
cedimento
Si potrebbe quindi eliminare la costante non significativa e ottenere un modello raffinato:
Notiamo che non sono state necessarie trasformazioni di potenza per ottenere un insieme di residui con una variazione costante. Si noti che le previsioni non sono esplosive.
In termini di una semplice somma ponderata, abbiamo: 13 pesi; 3 diverso da zero e uguale a (1.0.1,0., - 1,0)
Questo materiale è stato presentato in modo non automatico e, di conseguenza, ha richiesto l'interazione dell'utente in termini di decisioni di modellazione.