Anche se è un vecchio post, rispondendo ora perché sapevo che i valori di soglia di check_load sono grossi mal di testa per i neofiti ..;)
Un avviso di avviso, se la CPU è del 70% per 5 minuti, 60% per 10 minuti, 50% per 15 minuti. Un avviso critico, se la CPU è del 90% per 5 minuti, 80% per 10 minuti, 70% per 15 minuti.
*command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7*
Tutti i miei risultati sul carico della CPU:
Cosa significa "carico": Wikipedia dice:
Tutti i sistemi Unix e simili a Unix generano una metrica di tre numeri di "carico medio" nel kernel. Gli utenti possono facilmente interrogare il risultato corrente da una shell Unix eseguendo il comando uptime:
$ uptime
14:34:03 up 10:43, 4 users, load average: 0.06, 0.11, 0.09
Dalla media del carico di uscita sopra: 0.06, 0.11, 0.09
significa (su un sistema a CPU singola):
- durante l'ultimo minuto, la CPU è stata sottocaricata del 6%
- negli ultimi 5 minuti, la CPU è stata sottocaricata dell'11%
- durante gli ultimi 15 minuti, la CPU è stata sottocaricata del 9%
.
$ uptime
14:34:03 up 10:43, 4 users, load average: 1.73, 0.50, 7.98
La media del carico sopra di 1.73 0.50 7.98
su un sistema a CPU singola come:
- durante l'ultimo minuto, la CPU è stata sovraccaricata del 73% (1 CPU con 1,73 processi eseguibili, quindi 0,73 processi hanno dovuto attendere un turno)
- negli ultimi 5 minuti, la CPU è stata sottocaricata al 50% (nessun processo ha dovuto attendere un turno)
- durante gli ultimi 15 minuti, la CPU è stata sovraccaricata del 698% (1 CPU con 7,98 processi eseguibili, quindi 6,98 processi hanno dovuto attendere un turno)
Calcolo del valore di soglia di Nagios:
Per l'installazione di caricamento della CPU Nagios, che include avvisi e critici:
y = c * p / 100
Dove:
y = nagios value
c = number of cores
p = wanted load procent
per un sistema a 4 core:
time 5 min 10 min 15 min
warning: 90% 70% 50%
critical: 100% 80% 60%
command[check_load]=/usr/local/nagios/libexec/check_load -w 3.6,2.8,2.0 -c 4.0,3.2,2.4
Per un sistema single core:
y = p / 100
Dove:
y = nagios value
p = wanted load procent
time 5 min 10 min 15 min
warning: 70% 60% 50%
critical: 90% 80% 70%
command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7
Un ottimo white paper sull'analisi del carico della CPU del Dr. Gunther http://www.teamquest.com/pdfs/whitepaper/ldavg1.pdf
In questo articolo online il Dr. Gunther scava nel kernel UNIX per scoprire come calcolare il carico medio (il I "Tripletti di Los Angeles") vengono calcolati e quanto sono appropriati come metriche di pianificazione della capacità.
standard
otested
valore. Dipende dal carico di lavoro del server previsto. Se si prevede un carico elevato, è necessario aumentare i valori. Altrimenti, il tuo server apparirà sempre in stato critico.