A quali problemi dovrei prestare attenzione quando combino più serie temporali?


10

Supponiamo che io abbia un numero di serie temporali, ad esempio un numero di record di temperatura da varie stazioni in una regione. Voglio ottenere un unico record di temperatura per l'intera regione con la quale potrei descrivere aspetti del clima regionale. L'approccio intuitivo potrebbe essere semplicemente quello di prendere la media di tutte le stazioni ad ogni timestep, ma il mio senso del ragno statistico (che sicuramente non sono ancora in contatto con me) mi dice che questo potrebbe non essere così facile. In particolare, immagino che la media dell'intera regione rimuoverà alcuni degli estremi di temperatura interessanti e potrei avere problemi con la dipendenza tra stazioni vicine.

Quali altri problemi potrei affrontare se provassi una strategia come questa, e ci sono modi per superarli o metodi più sensati per combinare questo tipo di dati?

Nota: le risposte possono essere più generali dell'esempio spaziale che ho fornito.


1
Il problema potrebbe essere nel conflitto tra "un singolo record di temperatura per l'intera regione" e qualsiasi interesse che hai nella variazione all'interno della regione. Una soluzione potrebbe comportare un modo per riconciliare questi due problemi, ad esempio partizionando la varianza in componenti intra e interregionali.
Peter Ellis,

@PeterEllis, sì, ci stavo pensando vagamente. Ai fini della domanda, supponiamo che non mi interessi la variabilità spaziale intraregionale.
naught101

in quel caso, penso che la cosa principale di cui devi preoccuparti è la dipendenza tra stazioni vicine. Trova un modo per appesantire le osservazioni che duplicano efficacemente la stazione della porta accanto e dovresti essere a posto.
Peter Ellis,

@PeterEllis: ok, ma potrebbe non esserci un modo fisico ragionevole per farlo - La vicinanza delle stazioni non significa necessariamente che siano più dipendenti - cioè. due stazioni vicine ai lati opposti di una catena montuosa potrebbero essere meno simili di due stazioni distanti su un'ampia pianura. Esiste un modo affidabile per definire statisticamente la dipendenza? Covarianza, suppongo ... Ci sono ancora probabilmente meno picchi nelle serie risultanti (immagino che ciò rifletta la situazione fisica - i cambiamenti di temperatura in una vasta regione sono probabilmente più lenti e più stabili che in un singolo posto).
naught101

Per quanto riguarda l'aspetto spaziale della tua domanda, come vengono definite le tue regioni? Nel tuo commento, dici che due stazioni vicine ai lati opposti di una montagna potrebbero essere diverse da due stazioni distanti su un'ampia pianura. Hai preso in considerazione la ridefinizione delle regioni della stazione in base alla vicinanza e alla somiglianza per la tua analisi? Non dovrebbero necessariamente corrispondere ai confini regionali convenzionali. Invece potrebbero diventare una sovrapposizione analitica che potrebbe essere tracciata su una mappa tradizionale.
dav

Risposte:


1

Innanzitutto, vorrei dire che aggiungerei un commento, ma non posso ancora farlo (rappresentante), ma mi piace la domanda e volevo partecipare, quindi ecco una "risposta". Inoltre, vedo che questo è vecchio, ma è interessante.

Innanzitutto, sarebbe possibile utilizzare una tecnica di riduzione dimensionale, come la PCA, per condensare le serie temporali? Se il primo autovalore è grande, forse ciò significa che l'utilizzo dell'autovettore rappresenterebbe la maggior parte delle dinamiche.

In secondo luogo, e più in generale, qual è l'uso desiderato delle serie storiche? Non sapendo molto altro, immagino che le temperature possano variare abbastanza. Ad esempio, se alcuni record di temperatura sono vicini alle città, è possibile ottenere un effetto di tipo "isola di calore". O forse un piccolo cambiamento nella distanza laterale sembra produrre un grande cambiamento nella distanza verticale: una posizione potrebbe essere a livello del mare e proprio sull'oceano, e un'altra non "troppo lontana", ma a un chilometro di altezza. Quelle avrebbero sicuramente temperature diverse!

Questi sono solo alcuni pensieri. Forse qualcun altro potrebbe saltare e dare una risposta migliore.


1
Buon punto. Ad essere sincero, non ricordo quale fosse il contesto intorno a questa domanda e ho la sensazione che i miei commenti fossero fuorvianti. Ero particolarmente interessato a non perdere la variabilità comune a tutte le stazioni, ma fuori fase. Pensa alle stazioni di tutto il continente e al passaggio di un fronte freddo. Una semplice media spaziale potrebbe sostanzialmente rimuovere il fronte freddo, il che non è proprio una buona cosa, poiché ogni stazione lo esibirebbe fortemente, ma in momenti diversi. Probabilmente eseguire un qualche tipo di PCA su ciascuna stazione e quindi fare la media dei risultati in qualche modo potrebbe essere un modo per aggirare questo.
naught101

O wow, ok, quindi se stai cercando di caratterizzare la tendenza nelle serie temporali nella regione, forse dovresti rendere le serie temporali stazionarie e ognuna con una media di 0. Puoi anche provare a rimuovere il ciclo giornaliero da ciascuno (o semplicemente prendere le medie giornaliere). Quindi verrebbero lasciati cambiamenti di frequenza più bassi della temperatura, ciascuno centrato attorno a una media di 0. Una volta che hai quello, forse potresti condensare le serie temporali centrate + stazionarie usando una tecnica di riduzione dimensionale, come PCA. Sono contento che tu abbia parlato un po 'del contesto della domanda, b / c che aiuta davvero. Roba buona!
rbatt
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.