Correzione per imprecisione dell'orologio normalmente distribuita


10

Ho un esperimento che viene eseguito su centinaia di computer distribuiti in tutto il mondo che misura le occorrenze di determinati eventi. Ciascuno degli eventi dipende l'uno dall'altro, quindi posso ordinarli in ordine crescente e quindi calcolare la differenza di tempo.

Gli eventi dovrebbero essere distribuiti in modo esponenziale ma quando si traccia un istogramma questo è quello che ottengo:

Istogramma degli eventi

L'imprecisione degli orologi sui computer fa sì che ad alcuni eventi venga assegnato un timestamp prima di quello dell'evento da cui dipendono.

Mi chiedo se la sincronizzazione dell'orologio possa essere incolpata del fatto che il picco del PDF non è a 0 (che hanno spostato tutto a destra)?

Se le differenze di clock sono normalmente distribuite, posso solo supporre che gli effetti si compensino reciprocamente e quindi utilizzino solo il tempo calcolato diff?

Risposte:


13

Problemi di sincronizzazione dell'orologio potrebbero infatti causare lo spostamento del picco verso destra. La seguente simulazione in R mostra questo fenomeno. Ho usato i tempi esponenziali e normali differenze di clock per ottenere una forma che grosso modo assomiglia a tua immagine:

orologi

La distribuzione a sinistra (le differenze effettive, misurate senza errori) ha il suo picco a 0, mentre la distribuzione a destra (differenze misurate con l'errore) ha il suo picco intorno a 100.

R-code:

set.seed(20120904)

# Generate exponential time differences:
x<-rexp(100000,1/900)

# Generate normal clock differences:
y<-rnorm(100000,0,50)

# Resulting observations:
xy<-x+y

# Truncate at 500:
xy<-xy[xy<=500]

# Plot histograms:
par(mfrow=c(1,2))
hist(x[x<=500],breaks=100,col="blue",main="Actual differences")
hist(xy,breaks=100,col="blue",main="Observed differences")
lines(c(0,0),c(0,550),col="red")

Se le differenze di clock sono normali con la media 0, le differenze dovrebbero annullarsi nel senso che la media delle differenze osservate dovrebbe essere uguale a quella delle differenze effettive. Se questo è il caso dipende dalla presenza di una differenza sistematica tra i computer in cui si verifica il primo evento e i computer in cui si verifica il secondo evento.


4
+1 ben illustrato. Matematicamente, i dati sono tratti dalla somma della distribuzione dell'errore e della (presunta) distribuzione esponenziale. È allettante stimare la distribuzione degli errori e deconvolgere i dati per stimare la distribuzione reale.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.