In generale non ha senso sovrautilizzare i dati di proposito. Il problema è che è difficile assicurarsi che gli schemi compaiano anche nella parte che non è inclusa nei dati. Devi affermare che ci sono modelli nei dati. Una possibilità per farlo è il concetto di stazionarietà.
Quello che descrivi mi ricorda la stazionarietà e l'ergodicità. Dal punto di vista contestuale / aziendale, supponi che le tue serie temporali seguano determinati schemi. Questi schemi sono chiamati stazionarietà o ergodicità.
Definizione di stazionarietà:
Un processo stazionario è un processo stocastico la cui distribuzione di probabilità congiunta incondizionata non cambia quando viene spostata nel tempo. Pertanto anche parametri come media e varianza non cambiano nel tempo.
Definizione ergodicità:
Un processo ergodico è un processo relativo o denotante sistemi o processi con la proprietà che, dato il tempo sufficiente, includono o incidono su tutti i punti in un dato spazio e possono essere rappresentati statisticamente da una selezione ragionevolmente ampia di punti.
Ora vuoi assicurarti che segua davvero questi determinati schemi. Puoi farlo, ad es. Con il test radice dell'unità (come Dickey-Fuller) o il test di stazionarietà (come KPSS).
Test di radice dell'unità di definizione:
H0: esiste un'unità root.
H1: non esiste una radice unità. Ciò implica nella maggior parte dei casi stazionarietà.
Definizione Test di stazionarietà:
H0: c'è stazionarietà.
H1: non c'è stazionarietà.
Ulteriori letture:
Qual è la differenza tra un test stazionario e un test radice dell'unità?
Se la serie temporale segue davvero questi schemi, la previsione e la previsione saranno "più facili da un punto di vista statistico", ad esempio è possibile applicare modelli econometrici per previsioni come ARIMA o TBATS. La mia risposta si riferisce a serie temporali univariate e anche multivariate se si dispone di stazionarietà dei dati trasversali e le radici delle unità non sono concetti comuni.