Auto.arima vs autobox differiscono?


16

Dalla lettura dei post su questo sito so che esiste una funzione R auto.arima(nel forecast pacchetto ). So anche che IrishStat , un membro di questo sito ha creato il pacchetto commerciale autobox nei primi anni '80. Poiché questi due pacchetti esistono oggi e selezionano automaticamente i modelli arima per determinati set di dati, cosa fanno diversamente? Potrebbero forse produrre modelli diversi per lo stesso set di dati?


Grazie per la modifica @Wayne. Non ho familiarità con il pacchetto di previsioni R, ma sono sicuro che è ciò che intendo confrontare con Autobox.
Michael R. Chernick,

(Ho appena fatto una seconda piccola modifica di "auto-arima" in "auto.arima".) Potrebbero esserci altre auto.arimafunzioni là fuori in altri pacchetti, ma ce n'è sicuramente una in forecast, la cui descrizione è: "Restituisce il miglior modello ARIMA secondo valore AIC, AICc o BIC. La funzione effettua una ricerca su un modello possibile entro i vincoli dell'ordine previsti. "
Wayne,

1
AUTOBOX tratta l'identificazione automatica in modo olistico ripetendo l'identificazione automatica stimando e quindi eseguendo procedure diagnostiche di step-up e step-down per rendere un modello che ha solo parametri statisticamente significativi pur avendo un processo di errore privo di struttura identificabile In questo modo segue la sceneggiatura dell'iterazione. Le prime versioni di AUTOBOX intorno al 1975 tentarono di usare l '"approccio statistico unico", ma questo fu trovato mancante poiché i modelli identificati avevano una struttura ridondante o sciocca (5,1,2 per esempio) o evidenziavano una struttura insufficiente.
IrishStat,

1
@IrishStat Sembra un buon approccio. Cosa fai se trovi due modelli concorrenti che soddisfano le tue esigenze. Sembra possibile. Raccomandi un modello "ottimale" basato su criteri specifici? Mi rendo conto che la scelta di un modello con solo "parametri statisticamente significativi" può favorire la parsimonia Ma non è possibile avere un processo AR con parametri bassi e un altro modello AEMA di ordine basso in cui tutti i parametri sono statisticamente significativi e i residui sembrano bianchi rumore?
Michael R. Chernick,

1
@IriehStat. Sono d'accordo con te. Alla fine cosa fai per l'utente. Fornisci solo un modello o potresti fornire un elenco ordinato di modelli accettabili concorrenti? In caso contrario, forse sarebbe una buona opzione aggiungere dove limitare l'elenco a un piccolo numero.
Michael R. Chernick,

Risposte:


9

michael / wayne

AUTOBOX consegnerebbe / identificherà sicuramente un modello diverso se una o più delle seguenti condizioni sono soddisfatte

1) ci sono impulsi nei dati

2) c'è 1 o più spostamento di livello / passo nei dati

3) se ci sono impulsi stagionali nei dati

4) ci sono 1 o più andamenti dell'ora locale nei dati che non sono semplicemente corretti

5) se i parametri del modello cambiano nel tempo

6) se la varianza degli errori cambia nel tempo e nessuna trasformazione di potenza è adeguata.

In termini di un esempio specifico, vorrei suggerire a entrambi di selezionare / creare una serie temporale e di pubblicarli entrambi sul Web. Userò AUTOBOX per analizzare i dati in modalità automatica e posterò i modelli nell'elenco. Quindi esegui il programma R e poi ognuno di voi fa un'analisi obiettiva separata di entrambi i risultati, evidenziando somiglianze e differenze. Invia quei due modelli completi di tutto il materiale di supporto disponibile, compresi i termini di errore finali, per i miei commenti. Riassumi e presenta questi risultati all'elenco e poi chiedi ai lettori dell'elenco di VOTARE per quale procedura sembra migliore per loro.


Intendi una gara come questa ?
whuber

@whuber Sì. Forse anche usando qualche "esempio di libro di testo sconosciuto / codificato" che potrebbe essere usato come sfondo.
IrishStat,

22

Rappresentano due approcci diversi a due problemi simili ma diversi. Ho scritto auto.arimae @IrishStat è l'autore di Autobox.

auto.arima()per modelli ARIMA (stagionali) inclusi termini di derapata. Autoboxadatta modelli di funzioni di trasferimento per gestire spostamenti di livello e valori anomali. Un modello ARIMA è un caso speciale di un modello di funzione di trasferimento.

Anche se si disattivassero gli spostamenti di livello e il rilevamento anomalo Autobox, si otterrebbe un modello ARIMA diverso da quello auto.arima()dovuto alle diverse scelte su come identificare i parametri ARIMA.

Nei miei test sui dati della concorrenza M3 e M, auto.arima()produce previsioni più accurate rispetto Autoboxa questi dati. Tuttavia, Autoboxfunzionerà meglio con i dati che contengono valori anomali e variazioni di livello importanti.


3
Credo che ti riferissi a una versione di AUTOBOX di molti, molti anni fa. AUTOBOX è cambiato significativamente in questi molti anni. Se non sbaglio, hai confrontato solo le accuratezze di 1 origine che sono sicuro che sarai d'accordo è un campione di 1. Le accuratezze devono essere valutate da un numero di origini.
IrishStat,

15
Mi riferisco a confronti pubblicati tra migliaia di serie. Come caporedattore dell'International Journal of Forecasting, penso di avere qualche idea su come valutare le previsioni.
Rob Hyndman,

2
Non intendevo che questa domanda mettesse in evidenza argomenti su chi avesse il miglior algoritmo di previsione. Penso che sia autobox che auto.arima siano probabilmente dei pacchetti molto buoni. Un confronto diretto potrebbe non essere giusto per molte ragioni. 1) L'utente potrebbe non essere abbastanza esperto da sapere come giudicarli. 2) L'accuratezza delle previsioni su una singola serie storica è una schifezza. Si potrebbe avere un errore quadratico medio inferiore nella previsione, ma ogni volta che è coinvolta la casualità deve essere presa in considerazione. Devi guardare diverse serie e come suggerisce IrishStat dovresti guardare a diversi punti di partenza.
Michael R. Chernick,

Inoltre, sarebbero utili diversi punti per iniziare la previsione. 3) Nel mondo ARIMA ci sono rappresentazioni multiple per lo stesso modello di serie storiche, i processi AR finiti hanno rappresentazioni della media mobile infinita e viceversa. Quindi un AR di ordine basso potrebbe essere quasi lo stesso di una media mobile di ordine elevato o di un ARMA. Box suggerito sempre secondo il principio della parsimonia. Ma se hai molti dati puoi ottenere buone stime dei parametri e il modello di ordine elevato può generare quasi le stesse previsioni di quello parsimonioso. 4) I due pacchetti hanno obiettivi diversi.
Michael R. Chernick,

3
Il metodo si è evoluto nel tempo. Dave Reilly è molto attivo su questo sito come IrishStat ed è stato molto aperto a spiegare come funziona in termini generali. È un aspetto essenziale del business avere segreti commerciali e algoritmi proprietari. Dal suo punto di vista, R sta danneggiando i suoi affari proprio come lo è per SPlus. Ma non mostra amarezza ed è molto disposto a dimostrare il suo software come puoi vedere oggi. È anche disposto a fare test contro i concorrenti e credo che abbia partecipato a serie temporali per le competizioni di previsione.
Michael R. Chernick,

11

EDIT: Secondo il tuo commento, credo che se disattivi molte delle autoboxopzioni, probabilmente otterrai una risposta simile a auto.arima. Ma se non lo fai, e in presenza di valori anomali ci sarà sicuramente una differenza: auto.arimanon importa dei valori anomali, mentre autoboxli rileverà e li gestirà in modo appropriato, il che darebbe un modello migliore. Potrebbero esserci anche altre differenze, e sono sicuro che IrishStat può descriverle.


Credo che autoboxrilevi valori anomali e altre cose oltre alla semplice ricerca dei migliori coefficienti AR, I e MA. Se è corretto, richiederebbe più analisi e un paio di altre funzioni R per avere funzionalità simili. E IrishStats è un membro prezioso di questa comunità e abbastanza amichevole.

Naturalmente, R è gratuito e può fare cose bazillion oltre ARIMA.

Un'altra scelta gratuita per ARIMA in stile economico è X13-ARIMA SEATS, dall'US Census Bureau, che è open source. Ci sono file binari per Windows e Linux, ma è stato compilato direttamente sul mio Mac, dato che avevo già caricato il compilatore gnu gfortran. È il successore di X12-ARIMA, ed è stato appena rilasciato negli ultimi giorni, dopo anni di sviluppo e test. (Aggiorna X12 e aggiunge anche le funzionalità SEATS / TRAMO. X12 è lo strumento ufficiale degli Stati Uniti, mentre SEATS / TRAMO proviene dalla Banca di Spagna ed è lo "strumento europeo".)

Mi piace molto X12 (e ora X13). Se fornisci una buona dose di diagnostica e li leggi e scopri cosa significano, in realtà sono una buona educazione in ARIMA e nelle serie storiche. Ho sviluppato il mio flusso di lavoro, ma esiste un pacchetto R x12per eseguire la maggior parte del lavoro all'interno di R (devi ancora creare il file del modello di input (".spc") per X12).

Dico che X12 è bravo in "stile economico" ARIMA per indicare i dati mensili con più di 3 anni di dati. (Per utilizzare alcune funzionalità diagnostiche sono necessari più di 5 anni di dati.) Ha una funzione di identificazione anomala, può gestire tutti i tipi di specifiche anomale e può gestire vacanze, vacanze fluttuanti, effetti dei giorni di negoziazione e una miriade di cose economiche. È lo strumento che il governo degli Stati Uniti utilizza per creare dati destagionalizzati.


Alla mia domanda è stato davvero dato un set di dati, i due algoritmi potrebbero produrre diverse selezioni di modelli. È davvero la selezione automatica che mi interessa e non tutte le altre funzionalità diagnostiche che uno potrebbe avere e che l'altro no. È noto che la famiglia di modelli ARMA e due modelli della famiglia possono essere rappresentazioni alternative esatte o quasi esatte dello stesso modello. Quindi, se ci sono differenze minori nei processi di selezione, penso che potrebbero offrire diverse scelte di modello.
Michael R. Chernick,

3
@MichaelChernick: Ah. La mia ipotesi sarebbe che se disattivi tutte le cose automatiche, autoboxotterrai la stessa risposta. Ma uno dei punti di utilizzo autoboxè che rileverà valori anomali e li gestirà come tali, quindi il modello restituito sarebbe diverso se ci fossero valori anomali.
Wayne,

@Wayne +1 per ulteriori informazioni su X13-ARIMA SEATS e SEATS / TRAMO.
Graeme Walsh,

@Wayne A proposito, un altro "strumento europeo" è DEMETRA + .
Graeme Walsh,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.