Carico elevato su un server nagios - Quanti controlli di servizio per un server nagios sono troppi?


9

Ho un server nagios che esegue Ubuntu con un processore Intel 2.0 GHz, un array RAID10 e 400 MB di RAM. Monitora un totale di 42 servizi su 8 host, la maggior parte dei quali viene verificata utilizzando il plug-in check_http anche 5 minuti, alcuni ogni minuto. Recentemente il carico sul server nagios è stato superiore a 4, spesso alto come 6. Il server esegue anche cactus, raccogliendo statistiche ogni minuto per 6 host.

Mi chiedo, quanti servizi dovrebbe essere in grado di gestire hardware come questo? Il carico è così elevato perché sto spingendo i limiti dell'hardware o questo hardware dovrebbe essere in grado di gestire 42 controlli di servizio più i cactus? Se l'hardware è inadeguato, dovrei cercare di aggiungere più RAM, più core o core più veloci? Quali controlli hardware / di servizio sono in esecuzione?


Come appare l'utilizzo della RAM in questo momento sul server? Inoltre, come appare l'utilizzo della CPU? Se questo è alto, quali processi lo stanno ancorando?
3dinfluenza il

Hai risolto il problema ? Stiamo riscontrando lo stesso problema. Load avg is 12 ..
John

Risposte:


7

Devi capire dov'è il tuo collo di bottiglia ...

Corro un monitor nagios che controlla oltre 400 host con controlli http, ping e ssh. (insieme a molti altri controlli passivi e nscd)

Questo si trova su un server 2xQuadCore con 4 dischi SAS in RAID10.

Ho il sospetto che tu stia avendo una contesa di IO, dato che scrivere su molti rdd è molto inefficiente.

Devi capire quale processo sta assorbendo le tue risorse. (cactus, nagios o qualcos'altro)

Per il controllo IO, mi piace iotop. Installa iotop (il pacchetto 9.04 funziona su 8.04)

Ma altrimenti top dovrebbe anche aiutarti a trovare il tuo maiale.

I cactus una volta al minuto sono piuttosto aggressivi. (Corro il mio a intervalli di 5m)

Un approccio di cui ho sentito parlare per la contesa in scrittura di rrd è quello di mettere i tuoi negozi rrd su un ramdisk / tmpfs. (assicurati di risincronizzarlo di tanto in tanto nella memoria persistente)

In bocca al lupo.


Grazie. Ci penserò. Probabilmente sono i cactus a generare il carico e vedrò se c'è un modo per spostare i file rds in tmpfs. O semplicemente aggiungere più RAM in modo che il server possa bufferizzare i rrds. Temo che se corro cactus ogni 5 minuti potrebbero esserci picchi di carico che durano solo 1 o 2 minuti che mi mancherebbero del tutto ...
Josh,

6

A meno che non si tratti di cactus che generano la maggior parte del carico, dovresti essere in grado di eseguire molti più controlli rispetto a quelli sul tuo hardware.

Sto eseguendo nagios su una macchina virtuale FreeBSD in esecuzione su Microsoft Virtual Server su un vecchio PC dog-slow (Pentium 3 1GHz con un disco PATA lento). La macchina virtuale ha solo 128 MB di RAM e le prestazioni sono terribili.

Tuttavia, la media del carico è di circa 0,2, eseguendo 158 controlli su 42 host.


Grazie. Vorrei poter accettare entrambe le risposte! Il tuo è stato molto utile, mi indica che il cactus è probabilmente il colpevole.
Josh,

2

Su un vecchio PIII con 256 MB di RAM sto monitorando attivamente circa 230 servizi diversi. La stessa macchina esegue anche MRTG e HylaFAX per tutti i nostri fax in arrivo e lo fa abbastanza comodamente.


Informazioni molto utili Questo mi indica che il cactus è probabilmente il colpevole, non i nagios. Grazie!
Josh,

1

Dovresti essere in grado di eseguire un carico di nagios check con quell'hardware. Eseguiamo una configurazione simile con circa 70 assegni e Nagiosgraph: la differenza principale è la RAM aggiunta (è economica, quindi aumenterei la confezione a 2Gb).

Prova a eseguire top o ps -aux per vedere se la CPU è sovraccarica, ma ne dubito. Puoi anche controllare i documenti di parallelizzazione di nagios per vedere se la tua installazione sta provando a eseguire troppi controlli contemporaneamente anziché serializzarli.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.