Supponendo che uno abbia una serie temporale da cui si possono prendere varie misure come periodo, massimo, minimo, media ecc. E quindi usarle per creare un'onda sinusoidale modello con gli stessi attributi, ci sono approcci statistici che si possono usare che potrebbero quantificare quanto i dati reali si adattano al modello presunto? Il numero di punti dati nella serie dovrebbe variare tra 10 e 50 punti.
Un mio primo pensiero molto semplicistico è stato attribuire un valore al movimento direzionale dell'onda sinusoidale, ovvero +1 +1 +1 +1 -1 -1 -1 -1 -1 -1 -1 -1 +1 +1 +1 +1, fai lo stesso con i dati effettivi e poi quantifica in qualche modo il grado di somiglianza del movimento direzionale.
Modifica: dopo aver riflettuto maggiormente su ciò che voglio davvero fare con i miei dati e alla luce delle risposte alla mia domanda originale, ciò di cui ho bisogno è un algoritmo decisionale per scegliere tra ipotesi concorrenti: vale a dire che i miei dati sono sostanzialmente lineari (o trend) con rumore che potrebbe eventualmente avere elementi ciclici; i miei dati sono sostanzialmente ciclici senza alcuna tendenza direzionale di cui parlare; i dati sono essenzialmente solo rumore; o sta passando da uno di questi stati all'altro.
I miei pensieri ora sono forse di combinare qualche forma di analisi bayesiana e metrica euclidea / LMS. I passaggi di questo approccio sarebbero
Crea l'onda sinusoidale presunta dalle misurazioni dei dati
Adatta una linea retta LMS ai dati
Deriva una metrica euclidea o LMS per le partenze dai dati originali per ciascuno dei precedenti
Crea un priore bayesiano per ciascuno sulla base di questa metrica, ovvero il 60% delle partenze combinate si collega a uno, il 40% all'altro, quindi favorisce il 40%
fai scorrere una finestra di un punto dati lungo i dati e ripeti quanto sopra per ottenere nuove metriche% per questo set di dati leggermente modificato - questa è la nuova prova - fai l'analisi bayesiana per creare un posteriore e cambiare le probabilità che favoriscono ogni assunzione
ripetere lungo l'intero set di dati (oltre 3000 punti dati) con questa finestra scorrevole (lunghezza della finestra 10-50 punti dati). La speranza / intenzione è quella di identificare l'assunzione predominante / favorita in qualsiasi momento nel set di dati e come questo cambia nel tempo
Qualsiasi commento su questa potenziale metodologia sarebbe il benvenuto, in particolare su come potrei effettivamente implementare la parte di analisi bayesiana.