Innanzitutto è necessario notare che l'approccio delineato da IrishStat è specifico per i modelli ARIMA, non per qualsiasi set generico di modelli.
Per rispondere alla domanda principale "È possibile automatizzare la previsione delle serie storiche?":
Sì. Nel mio campo di previsione della domanda, la maggior parte dei pacchetti di previsioni commerciali lo fanno. Lo fanno anche diversi pacchetti open source, in particolare le funzioni auto.arima () (previsione automatizzata ARIMA) e ETS () (previsione automatizzata del livellamento esponenziale automatizzato) di Rob Hyndman dal pacchetto Previsione open source in R, vedere qui per i dettagli su queste due funzioni . C'è anche un'implementazione Python di auto.arima chiamata Pyramid , anche se nella mia esperienza non è matura come i pacchetti R.
Sia i prodotti commerciali che ho citato sia i pacchetti open source che ho citato funzionano in base all'idea di utilizzare criteri di informazione per scegliere la migliore previsione: si adatta un gruppo di modelli e quindi si seleziona il modello con AIC, BIC, AICc più bassi, ecc .... (in genere questo viene fatto al posto della convalida fuori campione).
Vi è tuttavia un avvertimento importante: tutti questi metodi funzionano all'interno di un'unica famiglia di modelli. Scelgono il miglior modello possibile tra una serie di modelli ARIMA o il miglior modello possibile tra una serie di modelli di livellamento esponenziale.
È molto più difficile farlo se si desidera scegliere tra diverse famiglie di modelli, ad esempio se si desidera scegliere il modello migliore tra ARIMA, Smoothing esponenziale e metodo Theta. In teoria, è possibile farlo nello stesso modo in cui si fa all'interno di una singola famiglia di modelli, ovvero utilizzando criteri di informazione. Tuttavia, in pratica, è necessario calcolare l'AIC o BIC esattamente allo stesso modo per tutti i modelli considerati, e questa è una sfida significativa. Potrebbe essere meglio utilizzare la convalida incrociata delle serie temporali o la convalida fuori campione anziché i criteri di informazione, ma sarà molto più intensivo dal punto di vista computazionale (e noioso da codificare).
Il pacchetto Prophet di Facebook automatizza anche la generazione di previsioni sulla base di modelli di additivi generali Vedi qui per i dettagli . Tuttavia Prophet si adatta a un solo modello, anche se un modello molto flessibile con molti parametri. L'ipotesi implicita del profeta è che un GAM sia "l'unico modello per dominarli tutti", che potrebbe non essere teoricamente giustificato, ma è molto pragmatico e utile per gli scenari del mondo reale.
Un altro avvertimento che si applica a tutti i metodi sopra menzionati: presumibilmente vuoi fare previsioni automatiche sulle serie temporali perché vuoi prevedere più serie temporali, troppe per analizzarle manualmente. Altrimenti potresti semplicemente fare i tuoi esperimenti e trovare il modello migliore da solo. È necessario tenere presente che un approccio di previsione automatizzato non troverà mai il modello migliore per ogni serie temporale - fornirà un modello ragionevolmente buono in media in tutte le serie temporali, ma è ancora possibile che alcuni di quelle serie storiche avranno modelli migliori di quelli selezionati dal metodo automatizzato. Vedi questo postper un esempio di questo. Per dirla semplicemente, se hai intenzione di seguire le previsioni automatizzate, dovrai tollerare le previsioni "abbastanza buone" invece delle migliori previsioni possibili per ogni serie temporale.