Quali sono le differenze tra i termini "analisi delle serie storiche" e "analisi dei dati longitudinali"


17

Quando parliamo di dati longitudinali, possiamo fare riferimento a dati raccolti nel tempo dalla stessa materia / unità di studio ripetutamente, quindi ci sono correlazioni per le osservazioni all'interno della stessa materia, vale a dire, somiglianza all'interno del soggetto.

Quando parliamo di dati di serie temporali, ci riferiamo anche ai dati raccolti in una serie di volte e sembra molto simile all'impostazione longitudinale sopra menzionata.

Mi chiedo se qualcuno può fornire un chiaro chiarimento tra questi due termini, qual è la relazione e quali sono le differenze?


1
Questo potrebbe trasformarsi in un sondaggio ... Ho lavorato su entrambi i tipi di dati e una differenza chiave sembra essere che i dati longitudinali vengono spesso utilizzati nelle analisi causali , per comprendere l'impatto di interventi o trattamenti, mentre le serie temporali vengono spesso utilizzate nelle previsioni . Naturalmente, la differenza non è chiara (è necessario comprendere i driver sottostanti per la previsione e IMO non si capiscono i driver a meno che non si riesca a prevedere bene). Ma le persone che rilevano il segnale nelle serie temporali spesso non si preoccupano molto delle previsioni, quindi probabilmente respingerebbero la mia distinzione.
S. Kolassa - Ripristina Monica l'

Grazie per i tuoi commenti Ma penso che il termine "causale" potrebbe non essere appropriato qui, piuttosto che il termine "associazione" dovrebbe essere migliore? Per quanto riguarda lo scopo dell'analisi dei dati, penso che i tuoi commenti abbiano avuto un senso per me. Ma non possiamo usare i dati longitudinali per fare previsioni? Dal momento che è anche una specie di dati di serie storiche.
chiedendo l'

1
Hai un punto su "causale" vs. "associazione", e ovviamente i dati longitudinali possono essere usati per prevedere - è solo che non vedo spesso i due concetti insieme. I meteorologi di solito parlano di serie storiche. A parte questo, non potrei metterlo meglio di @gung.
S. Kolassa - Ripristina Monica

3
Una delle possibili differenze tipiche (non definitive) è che nelle serie temporali si vede e si modella la risposta temporale come dipendente dallo stato t - 1 ; questo è l' effetto carryover . Nell'analisi del tempo longitudinale di solito si considera il tempo come fattore di fondo evolutivo permanente . tt1
ttnphns,

Risposte:


19

Dubito che esistano definizioni rigorose e formali su cui concordano un'ampia gamma di analisti di dati.

In generale, tuttavia, serie storiche storiche connotano una singola unità di studio osservata a intervalli regolari per un periodo di tempo molto lungo. Un esempio prototipico sarebbe la crescita annuale del PIL di un paese nel corso di decenni o anche più di cento anni. Per un analista che lavora per una società privata, potrebbe trattarsi di ricavi di vendita mensili per tutta la vita dell'azienda. Poiché ci sono così tante osservazioni, i dati vengono analizzati in modo molto dettagliato, cercando cose come la stagionalità in periodi diversi (ad esempio, mensili: più vendite all'inizio di un mese subito dopo che le persone sono state pagate; annuale: più vendite a novembre e Dicembre, quando le persone fanno shopping per il periodo natalizio) e possibilmente cambi di regime. Le previsioni sono spesso molto importanti, come osserva @StephanKolassa.

Longitudinale si riferisce in genere a meno misurazioni su un numero maggiore di unità di studio. Un esempio prototipico potrebbe essere una sperimentazione farmacologica, in cui ci sono centinaia di pazienti misurati al basale (prima del trattamento) e mensilmente per i prossimi 3 mesi. Con solo 4 osservazioni di ciascuna unità in questo esempio, non è possibile provare a rilevare i tipi di caratteristiche a cui gli analisti delle serie storiche sono interessati. D'altra parte, con i pazienti presumibilmente randomizzati nei bracci di trattamento e controllo, la causalità può essere dedotta una volta la non indipendenza è stata affrontata. Come suggerisce ciò, spesso la non indipendenza è considerata quasi un fastidio, piuttosto che la caratteristica principale di interesse.


8

Esistono circa tre tipi di set di dati:

  • sezione trasversale: soggetti diversi contemporaneamente; pensala come una fila con molte colonne corrispondenti a soggetti diversi;
  • serie storiche: lo stesso soggetto in momenti diversi; pensala come una colonna con righe corrispondenti a diversi punti temporali;
  • pannello (longitudinale): molti soggetti in momenti diversi, hai lo stesso soggetto in momenti diversi e hai molti soggetti allo stesso tempo; pensala come una tabella in cui le righe sono punti temporali e le colonne sono soggetti.

2
Sulla base dei tuoi commenti, sembra che i dati longitudinali siano un insieme di più dati di serie temporali raccolti da diversi soggetti?
chiedendo l'

1
In generale, sì, potresti vedere i dati di ciascun soggetto come serie temporali. In pratica, tuttavia, i dati longitudinali hanno spesso pochissimi punti temporali per ogni soggetto. Chiamano le onde dei punti temporali . Ad esempio, potrebbe essere uno studio medico in cui ogni paziente ha 4-5 osservazioni a intervalli mensili e centinaia di pazienti nel corso degli anni. In questo modo i set di dati dei panel sono spesso sbilanciati (si pensi a una tabella molto scarsa), quindi gli studi longitudinali hanno i loro metodi preferiti per affrontarli.
Aksakal,

Questo è utile alla domanda, ma ci sono molti altri tipi di set di dati che non rientrano in nessuna di queste voci. Tuttavia, non sembrano pertinenti alla domanda e cercare di classificare ogni possibile tipo di set di dati sarebbe inutile qui. Esempi: qualsiasi set di dati in cui la struttura di base è soggetto x soggetto; qualsiasi set di dati che non sia bidimensionale.
Nick Cox,

@NickCox, vero, ma sono in econometria, e questi tre sono quelli con teorie sviluppate e usati principalmente nel nostro campo
Aksakal,

2
Senza dubbio lo sei, ma nulla nella domanda obbliga o addirittura incoraggia un punto di vista strettamente econometrico, né la tua prospettiva specifica è stata resa esplicita.
Nick Cox,

3

Questi due termini potrebbero non essere correlati nel modo in cui l'OP assume - cioè, non penso che siano modalità di analisi concorrenti.

Invece l'analisi delle serie temporali descrive una serie di tecniche di livello inferiore che potrebbero essere utili per analizzare i dati in uno studio longitudinale.

L'oggetto di studio nell'analisi delle serie temporali è un segnale dipendente dal tempo.

La maggior parte delle tecniche per analizzare e modellare / prevedere questi segnali dipendenti dal tempo si basano sul presupposto che questi segnali sono scomponibili in vari componenti. I due più importanti sono:

  • componenti ciclici (ad esempio, giornaliero, settimanale, mensile, stagionale); e

  • tendenza

In altre parole, l'analisi delle serie temporali si basa sullo sfruttamento della natura ciclica di un segnale dipendente dal tempo per estrarre un segnale sottostante.


0

Per semplificare, assumerò uno studio sugli individui, ma lo stesso vale per qualsiasi unità di analisi. Non è complicato, le serie temporali sono dati raccolti nel tempo, che di solito implicano la stessa misurazione da una popolazione equivalente a intervalli di tempo separati - o raccolti continuamente ma analizzati a intervalli di tempo.
Dati longitudinali di portata molto più ampia. La popolazione equivalente viene sostituita dalla popolazione identica, quindi i singoli dati possono essere associati o uniti nel tempo. I dati longitudinali possono essere ripetuti misurazioni o meno a seconda dell'obiettivo dello studio. Quando i dati longitudinali sembrano una serie temporale è quando misuriamo la stessa cosa nel tempo. La grande differenza è che in una serie temporale possiamo misurare la variazione complessiva della misurazione nel tempo (o per gruppo) mentre in un'analisi longitudinale si ha effettivamente la misurazione della variazione a livello individuale. Quindi hai molto più potenziale per l'analisi e la misurazione del cambiamento è senza errori se è coinvolto il campionamento, quindi uno studio longitudinale può essere più preciso e informativo.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.