Ho un set di dati composto da serie temporali (8 punti) con circa 40 dimensioni (quindi ogni serie temporale è 8 per 40). L'output corrispondente (i possibili risultati per le categorie) è 0 o 1.
Quale sarebbe l'approccio migliore per progettare un classificatore per serie storiche con più dimensioni?
La mia strategia iniziale era quella di estrarre funzionalità da quelle serie storiche: media, standard, variazione massima per ogni dimensione. Ho ottenuto un set di dati che ho usato per addestrare un RandomTreeForest. Consapevole della totale ingenuità di questo, e dopo aver ottenuto scarsi risultati, ora sto cercando un modello più migliorato.
I miei lead sono i seguenti: classificare le serie per ogni dimensione (usando l'algoritmo KNN e DWT), ridurre la dimensionalità con PCA e utilizzare un classificatore finale lungo le categorie multidimensioni. Essendo relativamente nuovo in ML, non so se sbaglio totalmente.