Soluzioni grafiche Nagios vs Munin / Cacti / Ganglia


9

Ho un server nagios configurato per il monitoraggio di circa 30 server Windows. Voglio aggiungere alcuni grafici di tendenza. Ho letto che i plug-in grafici di nagios sono semplici e molte persone usano strumenti di creazione di grafici / trend separati e indipendenti.

Quali sono le restrizioni dei plug-in grafici nagios rispetto ai prodotti standalone come ganglia / munin / cactus?

Sono interessato a funzionalità e vantaggi specifici offerti dai pacchetti standalone e ai plug-in grafici nagios.


Dovresti anche considerare Zabbix ... serverfault.com/q/109595/2039
sebthebert

Prova opsview community edition, basato su nagios. È possibile installare in diverse versioni di Linux o scaricare VM. opsview.com/downloads/download-opsview-community
Matias Dominoni

Per la cronaca: ho provato il nagiosgraph e poi mi sono bloccato. Sono abbastanza contento di ciò che offre
sumek il

Risposte:


7

dato che hai già un'installazione di nagios, considera nagiosgraph o pnp4nagios.

nagiosgraph e pnp4nagios fanno un ottimo lavoro nel tracciare i dati sulle prestazioni di nagios. nagiosgraph ha un approccio alla configurazione basato su parametri, pnp4nagios ha un approccio basato su template.

  • entrambi rilevano automaticamente nuovi host / servizi ogni volta che cambia la configurazione di nagios
  • entrambi eseguono lo zoom grafico
  • entrambi forniscono grafici quando si passa il mouse su host / servizi specifici
  • entrambi forniscono molti modi per tagliare e tagliare i dati
  • sia rilevare che rappresentare graficamente i livelli critici e di avviso che sono già stati definiti nei nagios
  • entrambi possono essere incorporati direttamente nella cornice di nagios per una navigazione senza problemi e ordinata dallo stato corrente alla cronologia e viceversa

tagliare e tagliare i dati è piuttosto importante, imho. ad esempio, è possibile visualizzare tutti i servizi su un singolo host oppure visualizzare tutti gli host con un servizio specifico oppure visualizzare raccolte arbitrarie di grafici per host e servizi arbitrari.

l'installazione non è banale, ma non è difficile. molto dipende da quanto vuoi personalizzare le cose. ad esempio, nagiosgraph è 'install.pl' o 'rpm -i nagiosgraph.rpm' o 'dpkg -i nagiosgraph.deb'. pnp4nagios è './configure; rendere; make install '.

Anche n2rrd può fare alcune di queste cose, ma non è così raffinato e richiede più lavoro per la configurazione.

rrdtool ha stranezze nella memorizzazione dei dati e qualsiasi sistema avrà problemi di campionamento. rrdtool esegue alcuni smoothing dei dati per impostazione predefinita, ma è possibile acquisire (e rappresentare graficamente) i massimi e / o minimi oltre alle medie, se necessario.

ogni approccio basato su rrdtool soffre di staleness di dati / grafici poiché lo schema in ogni file rrd è statico e la maggior parte dei sistemi utilizza il nome file rrd per identificare i dati. i dati in genere non vengono mai persi quando cambia un nome host o un nome di servizio; i file rrd esistono ancora sul disco. ma alcune interfacce utente forniscono modi per vedere i file rrd 'stantii', altri richiedono pulizia manuale tramite riga di comando. su molte installazioni questo è solo un problema quando si configura inizialmente il sistema, ma in ambienti dinamici (ad esempio il monitoraggio di macchine virtuali la cui durata è di pochi mesi) può diventare noioso.

un'ultima nota. ci sono in realtà due parti di tendenza: raccolta e visualizzazione dei dati. se si utilizza un sistema grafico autonomo anziché estendere l'installazione di nagios esistente, potrebbe essere necessario installare componenti aggiuntivi sui computer Windows per raccogliere i dati.


13

Concordo con lynxman. NAGIOS è per dati qualitativi immediati (X è OK o no?); Munin è per dati quantitativi storici (quanto è pieno X ora e quanto è stato pieno quest'anno?). Tutte le mie installazioni NAGIOS, alcune delle quali monitorano diverse centinaia di servizi, sono collegate ai sistemi munin per effettuare il monitoraggio quantitativo.

Si noti inoltre che munin ha ganci specifici per l'immissione di dati in NAGIOS. Comprende il concetto di soglie AVVERTENZA e CRITICHE e dove è richiesta la notifica (e una visione sulla "scheda grande" di NAGIOS) è molto facile avere una singola variabile di munin che informi lo stato di un singolo servizio NAGIOS.

Il normale flusso di lavoro è che nessuno osserva i grafici di Munin fino a quando NAGIOS non avverte che è stata superata una soglia, ma poi i grafici di Munin diventano preziosi per scoprire se qualcosa è andato lentamente aumentando nel tempo, o questo è un -aumento blu, o abbiamo un ciclo settimanale su e giù che sta lentamente aumentando in ampiezza, o cosa.

Come dice lynxman, il modo UNIX è "un compito, uno strumento". Realizzare una toolchain di munin e NAGIOS funziona molto bene per me fornendo monitoraggio quantitativo e qualitativo e notifiche. Ha anche il netto vantaggio di mantenere pulite le interfacce: quando guardi NAGIOS, vedi una semplice visione di come stanno funzionando le cose in questo momento , senza dati storici che ingombrano la vista; quando guardi munin, vedi le informazioni storiche pertinenti al problema pronte per la tua analisi, senza errori "host down" o "sshd non mi parleranno" che ingombrano la vista.


3

I plugin grafici Nagios come dici tu sono molto limitati, offrono un'interfaccia rrdtool molto semplice e il design dell'interfaccia utente è un po 'contro intuitivo, è fondamentalmente un hack su nagios, ha provato a usarlo solo per divertimento ma si è rotto più volte senza preavviso.

Scegliere un prodotto autonomo (specialmente munin o ganglia) ti offre una vasta gamma di servizi che i nagios non possono realizzare, poiché il mantra unix è meglio essere bravi in ​​una cosa piuttosto che cercare di essere bravi in ​​molti, i nagios sono fantastici per monitoraggio e munin / ganglia / cactus sono fantastici nel rappresentare graficamente.


Cosa c'è dentro una vasta gamma di servizi che i nagios non possono realizzare ? Questo è quello che mi interessa.
Sumek,

Con nagios è molto facile perdere i dati del tuo grafico, è anche molto facile per il plugin interrompere la rappresentazione grafica dei dati in qualsiasi momento, non ti dà alcuna possibilità di zoomare in un momento specifico (cosa che fanno tutti gli altri), non ti dà la possibilità di creare grafici aggregativi complicati, e questo è solo per cominciare :)
lynxman

Cosa intendi per semplice perdita dei dati del tuo grafico ? Un rapido google mostra che tutte e 5 le soluzioni citate (gangli, munin, cactus, pnpgraph, nagiosgraph) utilizzano rrdtool per la memorizzazione dei dati dei grafici.
Il

Sì sumek, quello a cui mi riferisco è che di nuovo lo strumento di rappresentazione grafica su nagios è un hack, e ogni volta che c'è una discrepanza tra il nome del file rrd e le informazioni del grafico si romperà, se vuoi provarlo, soffro il dolore come me fatto e poi passare a una soluzione reale come Munin :)
lynxman

2

Stack Overflow usiamo n2rrd che è un plugin Nagios per rappresentare graficamente i dati delle prestazioni. In una certa misura sarei d'accordo con lynxman sul fatto che abbia una grande sensazione di hacking.

Però:

  • Con n2rrd puoi fare in modo che Cacti esegua la rappresentazione grafica in base ai dati anziché a rrd2graph.cgi fornito con n2rrd
  • n2rrd con rrd2graph.cgi supporta lo zoom
  • Per quanto riguarda i grafici aggregati complicati, in pratica manipoli manualmente i grafici rrd e puoi fare quello che vuoi con loro.

I grafici rrd sono memorizzati in base ai nomi dei server, quindi se cambi il nome di qualcosa che in un certo senso perdi i dati ... Puoi sempre semplicemente rinominare i file, ma li rimuovi in ​​modo simbolico e non perderai i dati.

Ho alcuni esempi di questi grafici nel mio recente post sul blog sui guasti dei server RRD Graphs Server. Inoltre, la pagina n2rrd include sia la demo dei cactus che rrd2graph.

Penso che la linea di fondo sia che percorrere la strada di Nagios potrebbe mancare in una o due funzionalità, ma è abbastanza completo se non ti dispiace sporcarti le mani con i dettagli di scrivere tu stesso i modelli rrd *. Probabilmente impiegherà più tempo ma incoraggerà a sviluppare maggiori competenze in rrd.


1
* [errore senza nota a piè di pagina]: cosa avresti aggiunto lì, kyle; le menti indagatrici devono sapere!
MadHatter,

0

Richiedo dati accurati e la visualizzazione dei dati di rrd non è accurata - è normalizzata! Per la maggior parte degli utenti questo va bene perché all'inizio non usano dati molto precisi. Stanno usando dati le cui frequenze di campionamento sono spesso al minuto o più e che non ti daranno una descrizione molto accurata di ciò che sta accadendo. Questo significa anche che se hai un picco nei tuoi dati da qualche parte potresti non vederli mai.

Considera questo: supponi che la tua rete Gb ronzii a circa 10 MB / sec e all'improvviso c'è un picco di 100 MB / sec per un paio di minuti. Inoltre, nota che se si trattava di un picco di soli 30 secondi, potresti non vederlo nemmeno alla frequenza di campionamento di pochi minuti. Se guardi i dati del giorno, quel 'picco' può apparire solo come 15 MB / sec, anche se il valore effettivo dipende anche da una serie di altri fattori. C'è anche una probabilità molto probabile che tu presuma che la tua rete sia felice quando non lo è!

Ciò che è ancora più frustrante per me sono i dati normalizzati alla larghezza fisica del grafico e all'intervallo dell'asse x. Che cosa significa questo picco che ho menzionato che non hai visto? Se lo ingrandisci appare magicamente! Continuerò con gnuplot - i grafici potrebbero non essere così belli ma sono solidi e gnuplot non modifica mai i dati prima di visualizzarli.

-marchio


0

Trovo che usare pnp4nagios funzioni abbastanza bene per la rappresentazione grafica. Supporta anche lo zoom. Non è il più facile da implementare, ma niente con i naghi lo è mai.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.