Ho delineato il mio viaggio verso il monitoraggio dei naghi sub-second-per-host tramite la miniera di sale e check_mk qui:
http://garthwaite.org/saltmine_check_mk_agent.html
L'articolo ripercorre settimane di armeggi e spegnimenti per far funzionare tutto. Riassumo la soluzione:
Crea un modulo check_mk personalizzato per tutti i seguaci:
#!/usr/bin/env python
''' Support for running check_mk_agent over salt '''
import os
import salt.utils
from salt.exceptions import SaltException
def __virtual__():
''' Only load the module if check_mk_agent is installed '''
if os.path.exists('/usr/bin/check_mk_agent'):
return 'check_mk'
return False
def agent():
''' Return the output of check_mk_agent '''
return __salt__['cmd.run']('/usr/bin/check_mk_agent')
Imposta l'intervallo miniera di Minion su un minuto:
salt '*' file.append /etc/salt/minion.d/mine.conf "mine_interval: 1"
Configura il server di monitoraggio per estrarre tutto l'output check_mk_agent del minion in un singolo file json, quindi configura check_mk per interrogare quel file invece di qualsiasi query di rete. Tutto realizzato con il seguente script sul seguace di monitoraggio:
#!/usr/bin/env python
import sys
import json
import fcntl
DATAFILE="/dev/shm/cmk.json"
NAG_UID = 105
NAG_GID = 107
def do_update():
import os
import salt.client
caller = salt.client.Caller()
data = caller.function('mine.get', '*', 'check_mk.agent')
lockfile = open(DATAFILE+".lock", "w")
fcntl.flock(lockfile, fcntl.LOCK_EX)
datafile = open(DATAFILE, "w")
datafile.write(json.dumps(data))
for f in (DATAFILE, DATAFILE+".lock"):
os.chmod(f, 0644)
os.chown(f, NAG_UID, NAG_GID)
def get_agent(minion):
lockfile = open(DATAFILE+".lock", "w")
fcntl.flock(lockfile, fcntl.LOCK_SH)
data = json.load(file(DATAFILE))
return data[minion]
if __name__ == '__main__':
if len(sys.argv) != 2:
print "Usage: mine_agent.py --update | <minion id>"
elif sys.argv[1] in ['--update', '-u']:
do_update()
else:
minion = sys.argv[1]
print get_agent(minion)
Aggiorna ogni minuto:
$ cat /etc/cron.d/retrieve_mined_minion_data
*/1 * * * * root /etc/check_mk/mine_agent.py --update
Infine: modifica l'origine dati per tutti i target nagios in /etc/check_mk/main.mk:
datasource_programs = [
( '/etc/check_mk/mine_agent.py <HOST>', ['mine'], ALL_HOSTS ),
]