Una delle questioni importanti che devono affrontare i meteorologi è se la serie data può essere prevista o no?
Mi sono imbattuto in un articolo intitolato " Entropia come indicatore a priori della prevedibilità " di Peter Catt che utilizza l' entropia approssimata (ApEn) come misura relativa per determinare una determinata serie temporale è prevedibile.
L'articolo dice:
"Valori più piccoli di ApEn indicano una maggiore probabilità che un insieme di dati sarà seguito da dati simili (regolarità). Al contrario, un valore più grande di ApEn indica una minore possibilità di ripetizione di dati simili (irregolarità). Pertanto, valori più grandi trasmettono più disordine , casualità e complessità del sistema ".
Ed è seguito da formule matematiche per il calcolo di ApEn. Questo è un approccio interessante perché fornisce un valore numerico che può essere usato per valutare la previdenza in senso relativo. Non so cosa significhi Entropia approssimativa, ne sto leggendo di più.
C'è un pacchetto chiamato pracma in R
che consente di calcolare ApEn. A scopo illustrativo, ho usato 3 diverse serie temporali e ho calcolato i numeri ApEn.
- Serie 1: la famosa serie storica AirPassenger - è altamente deterministica e dovremmo essere in grado di prevedere facilmente.
- Serie 2: Serie temporali Sunspot - è molto ben definita ma dovrebbe essere meno prevedibile della serie 1.
- Serie 3: numero casuale Non è possibile prevedere questa serie.
Quindi, se calcoliamo ApEn, la Serie 1 dovrebbe essere inferiore alla Serie 2 dovrebbe essere molto meno Serie 3.
Di seguito è riportato lo snippet R che calcola ApEn per tutte e tre le serie.
library("pracma")
> series1 <- approx_entropy(AirPassengers)
> series1
[1] 0.5157758
> series2 <- approx_entropy(sunspot.year)
> series2
[1] 0.762243
> series3 <- approx_entropy(rnorm(1:30))
> series3
[1] 0.1529609
Questo non è quello che mi aspettavo. La serie casuale ha un numero inferiore rispetto alla serie AirPassenger ben definita. Anche se aumento il numero casuale a 100, ottengo comunque quanto segue che è inferiore alla serie ben definita serie 2 / Sunspot.yealry.
> series3 <- approx_entropy(rnorm(1:100))
> series3
[1] 0.747275
Di seguito sono le mie domande:
- Ci sono 2 parametri nel calcolo di ApEn (
m
er
)? Come determinarli. Impostazioni predefinite utilizzate nelR
codice sopra. - Cosa sto facendo in modo errato che sta mostrando in modo errato che ApEn è inferiore per numeri casuali rispetto a una serie ben definita come sunspot.yearly.
- Dovrei deseasonalizzare / detrarre la serie e quindi stimare ApEn. L'autore ha comunque applicato ApEn direttamente alla serie.
- Esiste un altro modo per determinare se la serie è prevedibile?