Su diverse piattaforme di produzione abbiamo osservato sintomi che sembrano suggerire che l'ora dell'orologio sta saltando periodicamente in avanti o indietro. I salti sono in genere di circa 1 secondo, in genere si annullano (saltano avanti e indietro molto poco dopo) e si verificano circa 50 volte al giorno. Questa deriva è più evidente durante i periodi di massimo utilizzo delle applicazioni e durante i periodi di operazioni di I / O del disco elevate come i backup giornalieri. Queste derive stanno influenzando la nostra delicata applicazione sensibile in tempo reale.
I sistemi sono server Oracle Netra X4250 e Netra X4270 con SLES 11SP2 con kernel 3.0.58-0.6.6-default.
$ cat /sys/devices/system/clocksource/clocksource0/available_clocksource
tsc hpet acpi_pm
$ cat /sys/devices/system/clocksource/clocksource0/current_clocksource
tsc
Abbiamo disabilitato NTP , ma ciò non ha avuto alcun effetto sulle derive. Esistono strumenti che misurano la deriva dell'orologio? Come possiamo evitarlo?
Queste sono piattaforme di produzione e non possiamo ricreare il problema nei nostri laboratori, quindi la mia capacità di sperimentare è limitata. Se lasciato ai miei dispositivi, scriverò uno strumento per misurare la deriva e forse sperimenterò una sorgente di clock HPET .
ntpdate(8)
ontpd(8)
).