Selezione del modello Box-Jenkins


14

La procedura di selezione del modello Box-Jenkins nell'analisi delle serie temporali inizia osservando le funzioni di autocorrelazione e autocorrelazione parziale delle serie. Questi grafici possono suggerire l'appropriato e q in un ARMA ( p ,pq modello. La procedura continua chiedendo all'utente di applicare i criteri AIC / BIC per selezionare il modello più parsimonioso tra quelli che producono un modello con un termine di errore del rumore bianco.(p,q)

Mi chiedevo come questi passaggi dell'ispezione visiva e della selezione del modello basata su criteri incidessero sugli errori standard stimati del modello finale. So che molte procedure di ricerca in un dominio trasversale possono distorcere gli errori standard, ad esempio.

Nel primo passaggio, in che modo la selezione del numero appropriato di ritardi osservando i dati (ACF / PACF) influisce sugli errori standard per i modelli di serie storiche?

Immagino che la selezione del modello basato sui punteggi AIC / BIC avrebbe un impatto analogo a quello dei metodi trasversali. In realtà non so molto su quest'area, quindi qualsiasi commento sarebbe apprezzato anche su questo punto.

Infine, se si annotasse il criterio preciso utilizzato per ogni passaggio, è possibile avviare l'intero processo per stimare gli errori standard ed eliminare queste preoccupazioni?


la distorsione negli errori standard (dei parametri?) è così importante nei modelli ARMA a-teorici? I modelli ARMA ASFAIK sono utilizzati principalmente per le previsioni a breve termine. I problemi con l'interpretazione dei parametri e le loro proprietà sono meno importanti (almeno?). Ovviamente se non intendi le caratteristiche di un processo di innovazione (termine di errore), stai pianificando di produrre intervalli di previsione pertinenti.
Dmitrij Celov il

@Dmitrij, Ci sono due ragioni principali per cui sono preoccupato per la distorsione negli errori standard dei coefficienti. Il primo, come hai accennato, è la creazione di intervalli di previsione. Il secondo è testare le rotture strutturali del modello, una domanda comune a cui un economista sarebbe interessato a rispondere. Gli errori standard generati usando una procedura di selezione dovrebbero essere troppo piccoli, fornendo intervalli di previsione troppo stretti e testare statistiche troppo grandi.
Charlie,

ma nei modelli a-teorici (nel senso che non c'è teoria, nessuna struttura), le interruzioni strutturali hanno poco a che fare con i parametri che sarebbero alcuni test generali, riguardo al comportamento dei residui del modello. Bene, in questo caso le stime imparziali dei parametri dei modelli sono meno importanti, ARMA semplicemente non ha un'interpretazione dei modelli strutturali. Quindi i modelli parsimoniosi sono in effetti migliori predittori, poiché ben bilanciano le proprietà generalmente scarse dei piccoli stimatori del campione e l'accuratezza della previsione.
Dmitrij Celov,

Si noti che anche se si conosce il processo di generazione dei dati che ha molti parametri, in piccoli campioni un modello più semplice probabilmente farà previsioni migliori, ma in un contesto strutturale i parametri di tale modello saranno molto distorti (distorsione da variabili omesse)!
Dmitrij Celov,

Risposte:


5

Qualsiasi procedura di selezione del modello influirà sugli errori standard e questo non viene quasi mai considerato. Ad esempio, gli intervalli di previsione vengono calcolati in modo condizionale sul modello stimato e la stima dei parametri e la selezione del modello vengono generalmente ignorate.

Dovrebbe essere possibile avviare l'intero processo al fine di stimare l'effetto del processo di selezione del modello. Ma ricorda che il bootstrap delle serie temporali è più complicato del normale bootstrap perché devi preservare la correlazione seriale. Il bootstrap a blocchi è un approccio possibile sebbene perda una certa correlazione seriale a causa della struttura del blocco.


6

A mio avviso, selezionare il numero appropriato di ritardi non è diverso dalla selezione del numero di serie di input in una procedura di regressione in avanti graduale. L'importanza incrementale dei ritardi o di una serie di input specifica è la base per la specifica del modello provvisorio.

Dato che hai affermato che acf / pacf è l'unica base per la selezione del modello Box-Jenkins, lascia che ti dica cosa mi ha insegnato qualche esperienza. Se una serie mostra un acf che non decade, l'approccio Box-Jenkins (circa 1965) suggerisce di differenziare i dati. Ma se una serie ha un cambiamento di livello, come i dati del Nilo , la non stazionarietà "visivamente evidente" è un sintomo della struttura necessaria ma la differenza non è il rimedio. Questo set di dati del Nilo può essere modellato senza differenze semplicemente identificando prima la necessità di uno spostamento di livello. Allo stesso modo ci viene insegnato usando concetti del 1960 che se l'acf esibisce una struttura stagionale ( esvalori significativi in ​​ritardo di s, 2s, 3s, ...) quindi dovremmo incorporare un componente ARIMA stagionale. Ai fini della discussione, considera una serie stazionaria attorno a una media ea intervalli fissi, ad esempio ogni giugno c'è un "valore elevato". Questa serie viene correttamente trattata incorporando una serie fittizia "vecchio stile" di 0 e 1 (a giugno) al fine di trattare la struttura stagionale. Un modello ARIMA stagionale userebbe erroneamente la memoria invece di una variabile X non specificata ma in attesa di essere trovata. Questi due concetti di identificazione / incorporazione di una struttura deterministica non specificata sono applicazioni dirette del lavoro di I. Chang, William Bell, George Tiao, R.Tsay , Chen et al (a partire dal 1978) sotto il concetto generale di Rilevazione di interventi.

Ancora oggi alcuni analisti eseguono in modo insensato strategie di massimizzazione della memoria, chiamandole ARIMA automatico, senza riconoscere che la "modellazione della memoria senza mente" presuppone che la struttura deterministica come impulsi, cambiamenti di livello, impulsi stagionali e tendenze dell'ora locale siano inesistenti o peggio ancora non giocano ruolo nell'identificazione del modello. Questo è simile a mettere la testa nella sabbia, IMHO.


Grazie per l'eccellente consiglio sulla selezione del modello, ma ero interessato a come questo processo influisce sulla nostra inferenza in seguito.
Charlie

Charlie: Non credo che la diagnosi anticipata dei dati come la revisione di autocorrelazioni o correlazioni incrociate o qualsiasi altra procedura di identificazione del modello come le presentazioni grafiche abbia alcun effetto sulla significatività statistica di tutti i parametri stimati. Questa è la mia opinione e "eccomi qui, non posso fare altro". Grazie per i miei complimenti e se posso aiutare il giovane Charlie in qualche modo, ti prego di contattarmi perché amo essere elencato come risorsa di supporto (non retribuita!) Nelle tesi di dottorato.
IrishStat
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.