Sto cercando di rilevare valori anomali in una serie temporale di dati climatici con alcune osservazioni mancanti. Cercando sul web ho trovato molti approcci disponibili. Di questi, la decomposizione stl sembra allettante, nel senso di rimuovere la tendenza e le componenti stagionali e studiare il resto. La lettura di STL: una procedura di decomposizione delle tendenze stagionali basata su Loess , stl
sembra essere flessibile nel determinare le impostazioni per l'assegnazione della variabilità, non influenzata dai valori anomali e possibile applicare nonostante i valori mancanti. Tuttavia, provando ad applicarlo in R
, con quattro anni di osservazioni e definendo tutti i parametri secondo http://stat.ethz.ch/R-manual/R-patched/library/stats/html/stl.html , incontro errore:
"time series contains internal NAs"
(quando na.action=na.omit
) e
"series is not periodic or has less than two periods"
(quando na.action=na.exclude
).
Ho verificato due volte che la frequenza sia definita correttamente. Ho visto domande pertinenti nei blog, ma non ho trovato alcun suggerimento che potesse risolverlo. Non è possibile applicare stl
in una serie con valori mancanti? Sono molto riluttante ad interpolarli, poiché non voglio introdurre (e conseguentemente rilevare ...) artefatti. Per lo stesso motivo, non so quanto sia consigliabile utilizzare invece gli approcci ARIMA (e se i valori mancanti sarebbero comunque un problema).
Per favore condividi se conosci un modo per candidarti stl
in una serie con valori mancanti, o se ritieni che le mie scelte non siano metodologicamente valide o se hai qualche suggerimento migliore. Sono abbastanza nuovo nel settore e sopraffatto dai cumuli di informazioni (apparentemente ...) rilevanti.