Test di ipotesi e significato per le serie storiche


19

Un normale test di significato quando si osservano due popolazioni è il test t, se possibile test t associato. Ciò presuppone che la distribuzione sia normale.

Esistono ipotesi di semplificazione simili che producono un test di significatività per una serie storica? In particolare, abbiamo due popolazioni abbastanza piccole di topi che vengono trattati in modo diverso e stiamo misurando il peso una volta alla settimana. Entrambi i grafici mostrano funzioni in costante aumento, con un grafico decisamente sopra l'altro. Come possiamo quantificare la "chiarezza" in questo contesto?

L'ipotesi nulla dovrebbe essere che i pesi delle due popolazioni "si comportino allo stesso modo" con il passare del tempo. Come si può formulare questo in termini di un modello semplice abbastanza comune (così come le distribuzioni normali sono comuni) con solo un piccolo numero di parametri? Una volta fatto ciò, come si può misurare il significato o qualcosa di analogo ai valori p? Che dire di accoppiare i topi, abbinando il maggior numero possibile di caratteristiche, con ogni coppia che ha un rappresentante per ciascuna delle due popolazioni?

Gradirei un puntatore ad alcuni libri o articoli pertinenti ben scritti e facilmente comprensibili sulle serie storiche. Comincio come un ignorante. Grazie per l'aiuto.

David Epstein


Potresti voler lanciare una rete più ampia, perché questa non è necessariamente una domanda di serie storiche. In effetti, forse la domanda più fondamentale qui riguarda il modo migliore o almeno corretto per quantificare un "endpoint" di trattamento: è la crescita media in una popolazione dopo un certo tempo, i tassi di crescita medi nel tempo, ecc.? Se non lo sapevi prima di iniziare l'esperimento e stai improvvisamente notando differenze coerenti nelle curve di crescita, allora stai lavorando in una modalità esplorativa , non di conferma, e i valori p di verifica delle ipotesi saranno ingannevolmente buoni.
whuber

Il risultato è qualitativamente come previsto e un test unilaterale sembra appropriato. Il motivo per cui ho chiesto delle serie temporali è che se si misura solo il peso finale (che è la misura più rilevante), si stanno gettando via tutte le informazioni dai punti temporali precedenti e ciò sembra sbagliato.
David Epstein,

Hai ragione: non vuoi buttare via quei dati. Ma le tecniche delle serie temporali vengono alla ribalta per i modelli di dati in cui le correlazioni temporali delle deviazioni dalle curve idealizzate sono importanti, sia per il loro interesse o perché potrebbero interferire con una buona stima. È improbabile che la tua situazione cada in nessuno di questi casi. Sono disponibili metodi più semplici e scientificamente significativi.
whuber

@whuber, il peso nel tempo del set di controllo dei topi non è in qualche modo una "curva idealizzata"? O almeno un modello teorico adattato a quei dati?
naught101

1
Sì, @naught, questo è un modo ragionevole di vederlo. Ma "curva" non è la stessa di "serie storiche". Ad esempio, la regressione lineare può essere (e spesso viene) vista come curve adattate ai dati, ma è separata dall'analisi delle serie temporali, che enfatizza la struttura delle correlazioni tra le deviazioni tra i dati e la curva idealizzata.
whuber

Risposte:


1

Esistono molti modi per farlo se si considerano le variazioni di peso come un processo dinamico.

Ad esempio, può essere modellato come un integratore x˙(t)=θx(t)+v(t)

x(t)θv(t)v(t)N(0,Q)Q

θθθ1θ2

Per riferimento, posso suggerire questo libro .


0

Suggerirei di identificare un modello ARIMA per ciascun topo separatamente e quindi di esaminarli per similitudini e generalizzazione. Ad esempio, se il primo mouse ha un AR (1) e il secondo ha un AR (2), il modello più generale (più grande) sarebbe un AR (2). Stimare questo modello a livello globale, cioè per le serie storiche combinate. Confrontare la somma degli errori dei quadrati per l'insieme combinato con la somma delle due singole somma degli errori dei quadrati per generare un valore F per verificare l'ipotesi di parametri costanti tra i gruppi. Vorrei che tu possa pubblicare i tuoi dati e illustrerò questo test con precisione.

COMMENTI AGGIUNTIVI:

Poiché il set di dati è auto-correlato, la normalità non si applica. Se le osservazioni sono indipendenti nel tempo, si potrebbero applicare alcuni dei noti metodi delle serie non temporali. Per quanto riguarda la tua richiesta di un libro di facile lettura sulle serie storiche, suggerisco il testo Wei di Addison-Wesley. Gli scienziati sociali troveranno l'approccio non matematico di Mcleary e Hay (1980) più intuitivo ma privo di rigore.


1
Questo in realtà non sembra affrontare i problemi fondamentali. (1) Perché un modello del genere è appropriato? (2) Perché ogni topo dovrebbe essere modellato e non, diciamo, il peso medio della popolazione o i guadagni in termini di pesi? (3) Perché è rilevante un test di parametri costanti? La domanda richiede un test con una coda. La maggior parte dei parametri citati non sembrano scientificamente rilevanti, né quantificano direttamente la sensazione che un grafico sia costantemente al di sopra dell'altro. (4) Come controlli le possibili differenze nelle caratteristiche delle due popolazioni all'inizio dell'esperimento?
whuber

: whuber Il test di costanza dei parametri è rilevante perché hai un insieme di coefficienti per il primo gruppo di letture per 1 e un secondo insieme di coefficienti per il 2 ° mouse. La domanda è "c'è una differenza collettivamente significativa tra i coefficienti". Ora, continuando con il tuo commento, poiché uno dei coefficienti del modello potrebbe essere una costante e, in caso affermativo, la differenza tra i coefficienti potrebbe essere dovuta al fatto che le costanti sono statisticamente diverse l'una dall'altra. Si noti che il modello ARIMA sottostante non può necessariamente avere una costante come potrebbe essere un modello di differenza.
IrishStat,

1
Penso che tu abbia in parte ragione, ma devi perfezionare la tua caratterizzazione del problema. Molti dei coefficienti ARIMA possono essere scientificamente irrilevanti. Ad esempio, se uno di loro si comporta come un termine quadratico nel tempo, una differenza potrebbe dire qualcosa sulla forma delle curve di crescita, ma potrebbe essere di scarsa utilità. Se si scelgono i coefficienti per riflettere gli endpoint sperimentali e si testano solo loro, si potrebbe ottenere qualche bene in tal modo. In generale, tuttavia, i modelli di serie temporali introducono coefficienti (ad es. Autocorrelazione) che qui non hanno probabilmente un interesse scientifico diretto.
whuber

whuber: "Se si scelgono i coefficienti per riflettere gli endpoint sperimentali e si verificano solo loro, un po 'di bene potrebbe essere conseguito in tal modo" non ha molto senso per me in quanto ignora i punti intermedi. Al contrario del tuo commento, la modalità serie storica e i relativi coefficienti di accompagnamento sono di notevole interesse scientifico in quanto caratterizza la distribuzione delle letture e le converte in un processo casuale (il termine di errore) che è privo di struttura autocorrelativa e quindi suscettibile di test che richiede normalità. Il test che propongo richiede che tale presupposto sia valido.
IrishStat,

1
L'autocorrelazione può essere di scarsa importanza qui. L'interesse si concentra esplicitamente sulle tendenze: in che modo le curve di crescita sottostanti tendono a differire tra le due popolazioni? I parametri di autocorrelazione sono parametri di disturbo, che devono essere introdotti e trattati solo nella misura in cui potrebbero aiutare a migliorare la stima di tali curve di crescita. La prima priorità è adottare un modello scientifico di crescita, rappresentare quel modello con parametri che siano interpretabili e di interesse e stimarli . È improbabile che l'applicazione automatica delle tecniche delle serie temporali riesca a farlo.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.