In generale, penso che sia più fruttuoso scientificamente e statisticamente iniziare ponendo una domanda più ampia e diversa, che è fino a che punto è possibile prevedere una risposta da un predittore circolare. Dico circolare qui piuttosto che direzionale , in parte perché quest'ultimo include spazi sferici e persino più favolosi, che non possono essere coperti in un'unica risposta; e in parte perché i tuoi esempi, ora del giorno e periodo dell'anno , sono entrambi circolari. Un altro esempio importante è la direzione della bussola (rilevante per venti, movimenti di animali o umani, allineamenti, ecc.), Che presenta molti problemi circolari: in effetti, per alcuni scienziati è un punto di partenza più ovvio.
Ogni volta che puoi cavartela, usare le funzioni seno e coseno del tempo in una sorta di modello di regressione è un metodo di modellazione semplice e facile da implementare. È il primo punto di riferimento per molti esempi biologici e / o ambientali. (I due tipi sono spesso messi insieme, perché i fenomeni biotici che mostrano la stagionalità di solito rispondono direttamente o indirettamente al clima o agli agenti atmosferici.)
Per concretezza, immagina misurazioni del tempo nell'arco di 24 ore o 12 mesi, in modo che es
peccato[ 2 π( ora / 24 ) ] , cos [ 2 π( ora / 24 ) ]
peccato[ 2 π( mese / 12 ) ] , cos [ 2 π( mese / 12 ) ]
ognuno descrive un ciclo per l'intero giorno o anno. Un test formale di nessuna relazione tra una risposta misurata o contata e un certo tempo circolare sarebbe quindi un test standard per stabilire se i coefficienti di seno e coseno sono congiuntamente zero in un modello lineare generalizzato con seno e coseno come fattori predittivi, un legame appropriato e una famiglia essere scelto in base alla natura della risposta.
La questione della distribuzione marginale della risposta (normale o altro) è in questo approccio secondario e / o gestita dalla scelta della famiglia.
Il merito dei seni e dei coseni è naturalmente che sono periodici e si avvolgono automaticamente, quindi i valori all'inizio e alla fine di ogni giorno o anno sono necessariamente gli stessi. Non ci sono problemi con le condizioni al contorno, perché non c'è limite.
Questo approccio è stato chiamato regressione circolare, periodica, trigonometrica e di Fourier. Per una revisione introduttiva del tutorial, vedi qui
In pratica,
Tali test di solito mostrano risultati straordinariamente significativi a livelli convenzionali ogni volta che ci aspettiamo una stagionalità. La domanda più interessante è quindi la curva stagionale precisa stimata e se abbiamo bisogno di un modello più complicato anche con altri termini sinusoidali.
Nulla esclude anche altri predittori, nel qual caso abbiamo semplicemente bisogno di modelli più completi con altri predittori inclusi, ad esempio seni e coseni per la stagionalità e altri predittori per tutto il resto.
Ad un certo punto, dipendendo congiuntamente dai dati, dal problema, dai gusti e dall'esperienza del ricercatore, può diventare più naturale enfatizzare l'aspetto delle serie temporali del problema e costruire un modello con dipendenza temporale esplicita. In effetti, alcune persone statisticamente negherebbero che esiste un altro modo per affrontarlo.
Ciò che viene facilmente definito come tendenza (ma non sempre così facilmente identificabile) rientra in n. 2 o n. 3, o anche in entrambi.
Molti economisti e altri studiosi di scienze sociali interessati alla stagionalità nei mercati, nelle economie nazionali e internazionali o in altri fenomeni umani sono di solito più colpiti dalle possibilità di una variabilità più complicata all'interno di ogni giorno o (più comunemente) anno. Spesso, anche se non sempre, la stagionalità è una seccatura da eliminare o da adattare, a differenza degli scienziati biologici e ambientali che spesso considerano la stagionalità interessante e importante, anche l'obiettivo principale di un progetto. Detto questo, anche gli economisti e altri spesso adottano un approccio di tipo regressivo, ma con le munizioni un fascio di variabili indicatore (fittizie), più semplicemente variabili per ogni mese o trimestre di un anno0 , 1. Questo può essere un modo pratico per cercare di catturare gli effetti di vacanze, periodi di vacanza, effetti collaterali degli anni scolastici, ecc., Nonché influenze o shock di origine climatica o meteorologica. Con queste differenze notate, la maggior parte dei commenti sopra si applica anche in scienze economiche e sociali.
Gli atteggiamenti e gli approcci di epidemiologi e statistici medici interessati alle variazioni di morbilità, mortalità, ricoveri ospedalieri, visite cliniche e simili, tendono a incidere tra questi due estremi.
A mio avviso, dividere i giorni o gli anni a metà per confrontarli è di solito arbitrario, artificiale e nella migliore delle ipotesi scomodo. Sta anche ignorando il tipo di struttura liscia tipicamente presente nei dati.
MODIFICA Finora l'account non affronta la differenza tra tempo discreto e tempo continuo, ma dalla mia esperienza non lo considero un grosso problema in pratica.
Ma le scelte precise dipendono da come arrivano i dati e dal modello di cambiamento.
Se i dati fossero trimestrali e umani, tenderei a utilizzare le variabili degli indicatori (ad esempio, i trimestri 3 e 4 sono spesso diversi). Se mensile e umana, la scelta non è chiara, ma dovresti lavorare sodo per vendere seni e coseni alla maggior parte degli economisti. Se mensile o più fine e biologico o ambientale, sicuramente seno e coseno.
EDIT 2 Ulteriori dettagli sulla regressione trigonometrica
Un dettaglio distintivo della regressione trigonometrica (chiamato in altro modo se si preferisce) è che quasi sempre i termini seno e coseno sono presentati al meglio in un modello in coppia. Per prima cosa scaliamo l'ora del giorno, l'ora dell'anno o la direzione della bussola in modo che sia rappresentato come un angolo sul cerchio
in radianti, quindi sull'intervallo [ 0 , 2 π ] . Quindi usiamo tante coppie sin k θ , cos k θ , k = 1 , 2 , 3 , ...θ[ 0 , 2 π]peccatok θ , cosk θ , k = 1 , 2 , 3 , ...come sono necessari in un modello. (Nelle statistiche circolari, le convenzioni trigonometriche tendono a superare le convenzioni statistiche, in modo che simboli greci come sono usati sia per variabili che per parametri.)θ , ϕ , ψ
peccatoθ , cosθB1, b2B1peccatoθ , b2cosθpeccato( θ + ϕ )
peccatoθ cosϕ + cosθ peccatoϕ ,
cosφpeccatoφ
B1peccatoθ + b2cosθ