Google Trends restituisce i dati settimanali, quindi devo trovare un modo per unirli con i miei dati giornalieri / mensili.
Quello che ho fatto finora è stato di suddividere ogni serie in dati giornalieri, ad esempio:
a partire dal:
2013-03-03 - 2013-03-09 37
per:
2013-03-03 37 2013-03-04 37 2013-03-05 37 2013-03-06 37 2013-03-07 37 2013-03-08 37 2013-03-09 37
Ma questo sta aggiungendo molta complessità al mio problema. Stavo cercando di prevedere ricerche su Google dagli ultimi 6 mesi o 6 valori nei dati mensili. I dati giornalieri implicherebbero un lavoro su 180 valori passati. (Ho 10 anni di dati, quindi 120 punti in dati mensili / 500+ in dati settimanali / 3500+ in dati giornalieri)
L'altro approccio sarebbe quello di "unire" i dati giornalieri in dati settimanali / mensili. Ma alcune domande sorgono da questo processo. Alcuni dati possono essere mediati perché la loro somma rappresenta qualcosa. Le precipitazioni, ad esempio, la quantità di pioggia in una determinata settimana sarà la somma degli importi per ogni giorno che compone le settimane.
Nel mio caso ho a che fare con prezzi, tassi finanziari e altre cose. Per i prezzi è comune nel mio settore prendere in considerazione il volume scambiato, quindi i dati settimanali sarebbero una media ponderata. Per i tassi finanziari è un po 'più complesso alcune formule sono coinvolte per costruire tassi settimanali da tassi giornalieri. Per le altre cose non conosco le proprietà sottostanti. Penso che queste proprietà siano importanti per evitare indicatori insignificanti (una media dei tassi fidanzati sarebbe un non senso per esempio).
Quindi tre domande:
Per le proprietà note e sconosciute, come devo procedere per passare dai dati giornalieri a settimanali / mensili?
Sento che suddividere i dati settimanali / mensili in dati giornalieri come ho fatto è un po 'sbagliato perché sto introducendo quantità che non hanno senso nella vita reale. Quindi quasi la stessa domanda:
Per le proprietà note e sconosciute, come devo procedere per passare dai dati settimanali / mensili a quelli giornalieri?
Ultimo ma non meno importante: quando vengono fornite due serie temporali con diversi intervalli temporali, cosa è meglio: utilizzare il passaggio temporale più basso o più grande? Penso che questo sia un compromesso tra il numero di dati e la complessità del modello, ma non riesco a vedere alcun argomento forte tra cui scegliere.
Modifica: se conosci uno strumento (in R Python anche Excel) per farlo facilmente sarebbe molto apprezzato.