Basandosi sui commenti precedenti su Stack Overflow:
Sì, ha senso. Qui mi rivolgo alla domanda generale e sono felice di lasciare che gli esperti di R inseriscano i dettagli cruciali. Dal mio punto di vista, dato che ora si tratta di Cross-Validated, non dovremmo concentrarci troppo sul software preferito del poster, sebbene ciò sia importante per le persone affini.
Le date di qualsiasi software se non numeriche possono essere convertite in variabili numeriche, espresse in anni, giorni, millisecondi o qualsiasi altra cosa da qualche tempo. Il coefficiente associato a ciascuna data ha unità denominative che sono qualunque siano le unità della data. Le unità numeratrici dipendono da quelle della risposta o della variabile dipendente. (Le funzioni di collegamento non identitario lo complicano, naturalmente.)
Tuttavia, di solito ha più senso quando le date vengono spostate su un'origine che ha senso per lo studio. Di solito, ma non necessariamente, l'origine dovrebbe essere una data entro il periodo di studio o molto vicino ad essa.
Forse il caso più semplice è la regressione lineare su una variabile data in anni. Ecco una regressione di alcuni responsesu dateespressa in date come 2000 o 2010 implica un intercetto, che è il valore della responsenell'anno 0. Mettendo da parte dettaglio calendariale che non ci era tale anno, una tale intercettazione è spesso assurdamente grande positivo o negativo, che è logico ma una distrazione nell'interpretazione e nella presentazione (anche a un pubblico ben informato).
In un esempio reale del lavoro con studenti universitari, il numero di cicloni all'anno in una certa area stava aumentando leggermente con la data e una tendenza lineare sembrava un ragionevole primo colpo. L'intercettazione dalla regressione era un grande numero negativo, che causò molte perplessità fino a quando non si rese conto che questa era, come sempre, un'estrapolazione all'anno 0. Spostare l'origine su 2000 ha prodotto risultati migliori. (In realtà, una regressione di Poisson che assicurava previsioni positive era persino migliore, ma questa è una storia diversa.)
Regressing date - 2000o qualunque altra cosa sia quindi una buona idea. I dettagli sostanziali di uno studio indicano spesso una buona data di base, ovvero una nuova origine.
L'uso di altri modelli e / o altri predittori non mina questo principio; lo oscura e basta.
È anche una buona idea rappresentare graficamente i risultati utilizzando le date a cui è più facile pensare. Queste potrebbero essere le date originali; questa non è una contraddizione, in quanto è solo lo stesso principio dell'uso di qualsiasi cosa sia più facile a cui pensare.
Un piccolo pensiero dimostra che il principio è molto più generale. Spesso stiamo meglio con (età - 20) o qualcosa del genere, per evitare previsioni logiche ma scomode per l'età 0.
EDIT 21 marzo 2019 (originale 29 luglio 2013): questi argomenti sono stati discussi in un contesto Stata in Cox, New Jersey 2015. Specie di origine. Stata Journal 15: 574-587
vedi qui
EDIT 2 anche il 4 dicembre 2015 @whuber nei commenti solleva anche l'importante questione della precisione numerica. Spesso le unità di tempo vanno bene e le date o le date risultanti possono essere molto grandi, sollevando questioni importanti per le somme di quadrati, e così via e così via. Solleva un esempio da R. A che possiamo aggiungere (ad esempio) che gli orari delle date in Stata sono millisecondi dall'inizio del 1960. Questo problema non è affatto specifico per le date, poiché può sorgere generalmente con numeri molto grandi o molto piccolo, ma vale anche la pena contrassegnarlo.