Questo problema riguarda in realtà il rilevamento di incendi, ma è fortemente analogo ad alcuni problemi di rilevamento del decadimento radioattivo. I fenomeni osservati sono sia sporadici che altamente variabili; pertanto, una serie temporale sarà costituita da lunghe stringhe di zero interrotte da valori variabili.
L'obiettivo non è semplicemente catturare eventi (interruzioni negli zeri), ma caratterizzare quantitativamente gli eventi stessi. Tuttavia, i sensori sono limitati e quindi a volte registrano zero anche se la "realtà" è diversa da zero. Per questo motivo, è necessario includere zero durante il confronto dei sensori.
Il sensore B potrebbe essere più sensibile del sensore A e vorrei poterlo descrivere statisticamente. Per questa analisi, non ho "verità", ma ho un sensore C, che è indipendente dai sensori A&B. Quindi la mia aspettativa è che un migliore accordo tra A / B e C indichi un migliore accordo con la "verità". (Questo può sembrare traballante, ma dovrai fidarti di me: sono qui su un terreno solido, basato su ciò che è noto da altri studi sui sensori).
Il problema, quindi, è come quantificare "un migliore accordo sulle serie storiche". La correlazione è la scelta ovvia, ma sarà influenzata da tutti quegli zeri (che non possono essere esclusi) e ovviamente influenzata in modo sproporzionato dai valori massimi. RMSE potrebbe anche essere calcolato, ma sarebbe fortemente ponderato verso il comportamento dei sensori nel caso vicino allo zero.
Q1: Qual è il modo migliore per applicare un ridimensionamento logaritmico a valori diversi da zero che verranno quindi combinati con zero in un'analisi delle serie temporali?
D2: Quali "best practice" puoi consigliare per un'analisi di serie temporali di questo tipo, in cui il focus su valori diversi da zero è il focus, ma i valori zero dominano e non possono essere esclusi?