Modello di serie storiche dell'insieme


13

Devo automatizzare la previsione delle serie storiche e non conosco in anticipo le funzionalità di tali serie (stagionalità, tendenza, rumore, ecc.).

Il mio obiettivo non è quello di ottenere il miglior modello possibile per ogni serie, ma di evitare modelli piuttosto cattivi. In altre parole, ottenere piccoli errori ogni volta non è un problema, ma ottenere grossi errori ogni tanto lo è.

Pensavo di poterlo raggiungere combinando modelli calcolati con tecniche diverse.

Cioè, sebbene ARIMA sia l'approccio migliore per una serie specifica, potrebbe non essere il migliore per un'altra serie; lo stesso per il livellamento esponenziale.

Tuttavia, se combino un modello per ciascuna tecnica, anche se un modello non è così buono, l'altro avvicinerà la stima al valore reale.

È noto che ARIMA funziona meglio per le serie ben comportate a lungo termine, mentre il livellamento esponenziale si distingue per le serie rumorose a breve termine.

  • La mia idea è quella di combinare i modelli generati da entrambe le tecniche per ottenere previsioni più solide, ha senso?

Ci potrebbero essere molti modi per combinare quei modelli.

  • Se questo è un buon approccio, come dovrei combinarli?

Una semplice media delle previsioni è un'opzione, ma forse potrei ottenere previsioni migliori se ponderassi la media in base a qualche misura di bontà del modello.

  • Quale sarebbe il trattamento della varianza quando si combinano i modelli?

Le tue idee suonano alla grande, ma non sono così sicuro dell'uso automatico dei modelli ARIMA. Forse per le serie univariate ... La saggezza convenzionale è che Holt-Winters è usato in modo abbastanza robusto automaticamente, quindi potrebbe essere la base per confronti fuori campione tra metodi.
Scortchi - Ripristina Monica

@Scortchi Ho dimenticato di dire che tutte le serie sono univariate! ;) Concordo sul fatto che Holt-Winters si comporta davvero bene se utilizzato automaticamente, ma intendo ottenere un'altra opinione da un altro modello, per evitare casi in cui le previsioni non sono così buone. A volte HW mostra uno strano comportamento di tendenza.
João Daniel,

1
Anche nel caso univariato faccio fatica a immaginare una procedura automatica: c'è una tendenza (stocastica o deterministica), possibili trasformazioni, stagionalità (moltiplicativa o additiva) a cui pensare, e trovo che per arrivare a un modello io uso molte conoscenze precedenti su ciò che sarebbe sensato per ciò che una particolare serie rappresenta nella realtà. Tuttavia, la prova del budino sta nel mangiare - volevo solo dire di non dimenticare di fare confronti fuori campione con tecniche semplici - quindi buona fortuna.
Scortchi - Ripristina Monica

Risposte:


15

La combinazione delle previsioni è un'idea eccellente. (Penso che non sia un'esagerazione affermare che questa è una delle poche cose su cui i meteorologi accademici concordano.)

Mi è capitato di aver scritto un articolo qualche tempo fa guardando a diversi modi per ponderare le previsioni combinandole: http://www.sciencedirect.com/science/article/pii/S0169207010001032 Fondamentalmente, l'uso dei pesi (Akaike) non migliorava costantemente le combinazioni su mezzi o mediane semplici o ritagliati / vittorizzati, quindi personalmente ci penserei due volte prima di implementare una procedura complessa che potrebbe non produrre un beneficio definito (ricordo, tuttavia, che le combinazioni hanno sovraperformato i singoli metodi di selezione in base a criteri di informazione). Questo può dipendere dalle serie storiche che hai, ovviamente.

Ho esaminato la combinazione degli intervalli di previsione nel documento sopra, ma non la combinazione della varianza in quanto tale. Mi sembra di ricordare un documento non molto tempo fa nell'IJF con questo focus, quindi potresti voler cercare la "combinazione" o la "combinazione" attraverso i numeri arretrati dell'IJF.

Alcuni altri articoli che hanno esaminato la combinazione delle previsioni sono qui (dal 1989, ma una recensione) e qui e qui (guarda anche la densità) e qui e qui. Molti di questi notano che è ancora poco compreso il motivo per cui le combinazioni di previsioni spesso sovraperformano i singoli modelli selezionati. Il penultimo articolo è sulla competizione di previsione M3; uno dei loro principali risultati è stato (numero (3) a pag. 458) che "L'accuratezza della combinazione di vari metodi supera, in media, i metodi specifici che vengono combinati e fa bene rispetto ad altri metodi". L'ultimo di questi articoli rileva che le combinazioni non funzionano necessariamente meglio dei singoli modelli, ma che possono ridurre considerevolmente il rischio di fallimento catastrofico (che è uno dei tuoi obiettivi). Più letteratura dovrebbe essere facilmente reperibile nell'International Journal of Forecasting , il Journal of Forecasting e per applicazioni più specifiche nel campo dell'econometria o della letteratura sulla catena di approvvigionamento.


1
Ottimo punto di vista sulla combinazione di modelli! La tua risposta è stata molto costruttiva!
João Daniel,

@Stephan Kolassa, avresti qualche commento sulla combinazione di predittori avanti e indietro, come nel metodo di Burg?
denis,

@denis: non ho familiarità con i predittori avanti o indietro, né con il metodo di Burg, scusate ... anche se presumo che combinare previsioni / previsioni (alias metodi dell'insieme) di solito sarà utile.
Stephan Kolassa,

Ciao Stephan, ottimo articolo. Sembra che il sito del diario sia cambiato e non sembra più possibile scaricare il codice R dal sito principale. Lo stai ospitando su un sito diverso ora?
Ian

@Ian: potresti non averne accesso se non ti iscrivi. Inviami una e-mail ( trova il mio indirizzo qui ), invierò gli script. Dammi qualche giorno per scavarli.
Stephan Kolassa,

1

Perché non specificarlo ulteriormente? Non penso che nessun modello che potresti produrre potrebbe essere migliore o abbastanza buono di una scelta specifica.

Detto questo, se riesci a restringere un po 'le tue scelte a quelle per le quali puoi testare e l'inserimento dei dati può essere standardizzato, allora perché non scrivere una procedura di test automatizzata in R?

Supponiamo che tu decida che i tuoi dati rientreranno in un intervallo stimato da cinque modelli e da un "fallback". Supponiamo che tu possa caratterizzare l'input con diversi test. Quindi vai avanti e scrivi un algoritmo R (o un programma simile) che esegue questo per te. Funziona se è possibile produrre un diagramma di flusso di quale modello eseguire in base ai dati di test, ovvero se qualsiasi punto dell'albero decisionale è binario.

Se questa non è un'opzione perché la decisione potrebbe non essere binaria, ti suggerisco di implementare un sistema di classificazione basato su test applicabili ed eseguire alcuni dati simulati "casi estremi" attraverso la griglia per vedere se i risultati sono quelli che stai cercando.

È possibile combinare queste cose ovviamente, ad esempio testare la non stazionarietà può dare un sì-no definitivo, mentre altri attributi possono rientrare in un intervallo come la multicollinearità.
Puoi prima disegnarlo su carta, quindi costruirlo, simularlo con le distribuzioni conosciute che ti aspetti di avere.

Quindi esegui il programma R ogni volta che arrivano nuovi dati. Non vedo la necessità di combinare diversi modelli con le capacità computazionali che molto probabilmente hai a portata di mano.


Restringere le scelte è una buona idea, come non usare metodi non stagionali se i dati sono ovviamente stagionali. Ma anche allora, direi che la media di più modelli stagionali (stagionalità additiva vs. moltiplicazione, con o senza tendenza, ecc.) Migliorerà in media la precisione delle previsioni. Almeno questa è l'impressione che ottengo da un po 'di esposizione alla comunità di previsione, nonché all'M3 e alle competizioni di previsione simili.
Stephan Kolassa,

Hai ulteriori documenti su questo? Voglio dire, questo sarebbe un argomento di ricerca diretto ma pertinente. Un'idea molto interessante, anche se solo intuitivamente non concordo sul fatto che sarebbe necessariamente meglio di una griglia dinamica di modelli.
IMA

Buon punto. Ho modificato la mia risposta per includere un paragrafo aggiuntivo con più puntatori alla letteratura. Concordo sul fatto che ciò sia semplice e pertinente, ed è ancora poco compreso il motivo per cui la media delle previsioni di solito migliora la precisione.
Stephan Kolassa,

Sì, voglio dire, potresti modellare tutti i tipi di problemi distributivi e attaccarli a livello computazionale e fondamentalmente. Grazie per i documenti, molto interessante.
IMA,

0

Esistono formule semplici e piacevoli per combinare due metodi di previsione, basta ponderarli moltiplicando il primo per a e l'altro per (1 - a), dove a si trova minimizzando la varianza di questa previsione combinata. Come conosci gli errori di entrambi i metodi di previsione, puoi calcolare gli errori della combinazione che dipenderà da "a". Il calcolo è semplice quando la media di ciascun metodo è = 0. Per combinare più di 2 metodi le formule sono ancora "semplici", nel senso che è possibile calcolarlo analiticamente "a mano", oppure utilizzare anche l'opzione Risolutore da EXCEL


Puoi fare riferimento a questo metodo.
horaceT
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.