Sto cercando di automatizzare il rilevamento anomalo nelle serie temporali e ho usato una modifica della soluzione proposta da Rob Hyndman qui .
Ad esempio, misuro le visite giornaliere a un sito Web di vari paesi. Per alcuni paesi in cui le visite giornaliere sono poche centinaia o migliaia, il mio metodo sembra funzionare ragionevolmente.
Tuttavia, nei casi in cui un paese porta a solo 1 o 2 visite al giorno, i limiti dell'algoritmo sono molto stretti (ad es. 1 ± 0,001) e quindi le 2 visite sono considerate un valore anomalo. Come potrei rilevare automaticamente tali casi e come potrei trattarli per identificare i valori anomali? Non vorrei impostare una soglia manuale di, diciamo, 100 visite al giorno.
Grazie!