Qual è la strategia per rilevare la deriva temporale in un data center basato su Linux?


14

Qual è la strategia per rilevare la deriva temporale in tutti i data center basati su Linux? Questo è un problema più difficile di quanto sembri inizialmente.

La deriva temporale può causare seri problemi per alcune applicazioni e spesso, anche se è installato NTP, è possibile fallire per i seguenti (e molti altri) motivi:

  • NTP non è stato impostato correttamente per il riavvio automatico al riavvio.
  • Le impostazioni su un server sono errate, quindi il time server a cui punta è irraggiungibile o impreciso.
  • Il server orario principale non è raggiungibile e tutti i server che si stanno sincronizzando con esso si stanno ora sincronizzando con una fonte inaffidabile.

Vorrei un modo per rilevare se tutti i singoli server sono corretti. Tenere presente che il server con lo script / l'applicazione di test potrebbe non essere corretto.


6
Penso che i tuoi motivi siano falsi, l'NTP operativo è fondamentale per l'azienda. Assicurati che NTP funzioni correttamente. Inoltre, distribuire un master clock locale.
user539484

NTP funziona subito con molte distro Linux con impostazioni predefinite ragionevoli. È praticamente un non-problema ora.
Matt

Risposte:


20

Questo è facile da controllare. La gestione della configurazione è la chiave ...

Assicurarsi che il servizio NTTP sia in esecuzione e configurato ...

Ad esempio, usare Monit per assicurarsi che ntpdsia in esecuzione e riavviarlo se fallisce è un approccio semplice ... Potrebbe avere senso aggiungere cron e altri demoni essenziali a quel tipo di controllo.

Un'altra opzione è utilizzare uno strumento di gestione della configurazione come Puppet per forzare lo stesso ntpd.conf sui server e assicurarsi che ntpd sia installato, configurato e in esecuzione.

Esistono sufficienti ridondanze nel protocollo NTP per far sì che l'istanza di un time server non sia raggiungibile. Specifica più fonti.


3
Devo fare eco a questo sentimento. La gestione della configurazione e più server NTP sono elementi piuttosto basilari dell'infrastruttura in qualsiasi cosa si avvicini a un "data center". Un data center medio o più grande dovrebbe avere un orologio hardware. Le fonti di tempo GPS possono essere acquistate per poche centinaia e se hai un saldatore <$ 100.
Chris S,

questa soluzione + nagios
quel tizio di laggiù

4
Si noti che il modo in cui si controlla lo ntpdstato è piuttosto importante. Non vuoi solo dire "ntpd è in esecuzione. È tutto fantastico!". È necessario verificare effettivamente che il sistema si stia sincronizzando e abbia un peer funzionale o che l'offset temporale sia minimo tra l'host e la casella di monitoraggio . Nagios ha check_ntp_peere check_ntp_timeche gestiscono ciò, se si desidera utilizzare Nagios.
voretaq7,

ntpq per verificare lo stato
kubanczyk,

10

Ci sono una varietà di plugin per check_ntp Nagios là fuori.

Eccone uno:

http://nagiosplugins.org/man/check_ntp

Aggiungi questo controllo al tuo host nagios e ricevi avvisi se qualcosa va storto.


Sì, basta impostare il sistema di monitoraggio per verificare che il tempo sia valido o almeno l'offset relativo al sistema di monitoraggio sia minimo.
Zoredache,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.