Analisi della correlazione incrociata tra processi punto


15

Vorrei un consiglio su un metodo di analisi che sto usando, per sapere se è statisticamente valido.

Ho misurato due punti processi e T 2 = t 2 1 , t 2 2 , . . . , T 2 m e voglio per determinare se gli eventi in T 1 sono in qualche modo correlati agli eventi in T 2 .T1=t11,t21,...,tn1T2=t12,t22,...,tm2T1T2

Uno dei metodi che ho trovato in letteratura è quello di costruire un istogramma di correlazione incrociata: per ogni troviamo il ritardo a tutti gli eventi di T 2 che ricadono in una determinata finestra temporale (prima e dopo t 1 n ), quindi costruiamo un istogramma di tutti questi ritardi.tn1T2tn1

Se i due processi non sono correlati mi aspetterei un istogramma piatto, poiché la probabilità di avere un evento in dopo (o prima) un evento in T 1 è uguale in tutti i ritardi. D'altra parte, se c'è un picco nell'istogramma, ciò suggerisce che il processo a due punti si sta in qualche modo influenzando a vicenda (o, almeno, ha un input comune).T2T1

Ora, questo è buono e buono, ma come faccio a determinare se gli istogrammi hanno un picco (devo dire che per il mio particolare set di dati sono chiaramente piatti, ma sarebbe comunque bello avere un modo statistico di confermandolo)?

T1T2T2

times2.swp <- cumsum(sample(diff(times2)))

T2T1

T2T1

Vorrei quindi prendere questo valore del 95% per tutti i ritardi e utilizzarlo come un "limite di confidenza" (probabilmente questo non è il termine corretto) in modo che tutto ciò che supera questo limite nell'istogramma originale possa essere considerato un "vero picco".

Domanda 1 : questo metodo è statisticamente corretto? In caso contrario, come affronteresti questo problema?

Domanda 2 : un'altra cosa che voglio vedere è se esiste un tipo "più lungo" di correlazione dei miei dati. Ad esempio, potrebbero esserci cambiamenti simili nel tasso di eventi nei processi a due punti (si noti che potrebbero avere tassi abbastanza diversi), ma non sono sicuro di come farlo. Ho pensato di creare una "busta" di ciascun processo puntuale usando una sorta di smoothing kernel e quindi di eseguire un'analisi di correlazione incrociata delle due buste. Potresti suggerire qualsiasi altro possibile tipo di analisi?

Grazie e scusa per questa lunghissima domanda.

Risposte:


11

Un metodo standard per analizzare questo problema in due o più dimensioni è la funzione K (incrociata) di Ripley , ma non c'è motivo di non usarlo anche in una dimensione. (Una ricerca su Google fa un buon lavoro di ricerca di riferimenti.) In sostanza, traccia il CDF di tutte le distanze tra i punti nelle due realizzazioni piuttosto che un'approssimazione di un istogramma al PDF di quelle distanze. (Una variante, la funzione L, traccia la differenza tra K e la distribuzione nulla per due processi uniformi non correlati.) Questo risolve ordinatamente la maggior parte dei problemi che stai affrontando con la necessità di scegliere i contenitori, per smussare, ecc. Bande di fiducia per K vengono in genere creati tramite simulazione. Questo è facile da fare in R. Molti pacchetti di statistiche spaziali per R possono essere usati direttamente o prontamente adattati a questo caso 1D. Roger Bivand'sla pagina panoramica su CRAN elenca questi pacchetti: fare riferimento alla sezione "Analisi del modello a punti".


Interessante ... Sono un po 'impegnato al momento, ma lo darò sicuramente un'occhiata!
nico,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.