Devo implementare il rilevamento di anomalie su diversi set di dati di serie storiche. Non l'ho mai fatto prima e speravo in qualche consiglio. Mi sento molto a mio agio con Python, quindi preferirei implementare la soluzione (la maggior parte del mio codice è Python per altre parti del mio lavoro).
Descrizione dei dati: sono i dati mensili delle serie temporali che hanno appena iniziato a essere raccolti negli ultimi 2 anni circa (ovvero solo 24-36 periodi di tempo). In sostanza, ci sono diverse metriche monitorate su base mensile per diversi clienti.
time_period client metric score
01-2013 client1 metric1 100
02-2013 client1 metric1 119
01-2013 client2 metric1 50
02-2013 client2 metric2 500
...
Ecco cosa sto pensando: estrarre i dati in un dataframe (panda), quindi calcolare una media mobile di 6 mesi per ogni coppia cliente / metrica. Se il valore del periodo di tempo corrente supera una certa soglia in base alla media a 6 mesi, alza il flag. Il problema sembra piuttosto semplice. Voglio solo assicurarmi di adottare un approccio solido.
Qualche consiglio per approfondire un po 'questa idea sarebbe molto apprezzato. So che la domanda è un po 'astratta e mi scuso per quello.