Quali sono i tuoi plugin Nagios più utili / apprezzati? [chiuso]


33

Stiamo espandendo la nostra configurazione di Nagios 3 e spesso incontriamo nuovi plugin NRPE o Nagios generici per testare la nostra infrastruttura esistente. Questo è in gran parte - tuttavia sarebbe utile ottenere un riepilogo dei plugin che gli utenti di Nagios apprezzano maggiormente.

Elenca un singolo plug-in per post, preferibilmente con una breve descrizione del motivo per cui lo ami e un link al sito di MonitoringExchange o sviluppatore di plug-in. In questo modo la gente può votare per i plugin già elencati e possiamo vederli in ordine preferenziale.

Sarebbe meglio non elencare i plugin che altri hanno già menzionato, per lo stesso motivo. Se hai altro da aggiungere su un plug-in che qualcun altro ha elencato, lascia un commento alla sua risposta.

Grazie!

Risposte:


8

In termini di flessibilità, non puoi battere il plug-in snmp. È dietro quasi ogni controllo che eseguo e, in caso contrario, la connessione TCP è.


snmp check sembra piuttosto buono per il preferito in questa fase Matt (e altri :) - hai qualche tecnica speciale che usi con esso? La mia principale mania con net-snmpd al momento è la complessità della "nuova" funzionalità di estensione piuttosto che di esecuzione - check_snmpd gestisce bene?
Mike Pountney,

7

I nostri plugin più utili sono quelli che testano la nostra funzionalità applicativa superiore. Ad esempio, abbiamo dei test che provano ad accedere al sito Web e dei test che provano a inviare un'e-mail e selezionano una casella pop3 per assicurarsi che sia arrivata. Se una di queste cose si rompe, allora possiamo usare i controlli di livello inferiore per vedere cosa c'è che non va. Pop3 è morto? l'MTA, l'MDA? Il server di database? il datastore?


Wotcha Dave;) Hai qualche consiglio su come collegare i controlli di livello superiore e inferiore? Ad esempio, come si crea una dipendenza tra l'invio di un'e-mail e il controllo della casella pop3 per vedere che è lì? È possibile farlo esclusivamente tramite Nagios o stai usando la tua logica?
Mike Pountney,

Sei davvero sveglio alle 4 del mattino? :) Nagios ha dipendenze di servizio, quindi puoi fare in modo che il tuo controllo e-mail dipenda dai controlli smtp, MDA e POP3, ma questo significa solo che il controllo e-mail non avvisa se uno di quelli di livello inferiore lo fa. Questo diventa molto più difficile se si dispone di un cluster di server che fornisce un servizio in quanto non esiste alcun modo per nagios dire "non avvisarci per questo servizio se tutti questi servizi sono morti". Di solito ci basiamo solo sul sapere come il sistema si adatta per sapere dove si trovano i problemi.
David Pashley,

7

Onestamente, quello che fa di più per me è semplicemente vecchio check_disk. Niente mi fa sentire così speciale, in quel modo "smetti di mangiare la pasta", come avere un server che funzionava bene ieri saltare in aria, correre come un matto e poi scoprire che è perché ho lasciato riempire i dischi. Non doverlo rifare mai più nella mia vita per me vale molto.

(E non dimenticare di controllare anche gli inode, i bambini che guardano a casa.)


7

WebInject è molto utile per il monitoraggio di siti Web se si desidera andare oltre la funzionalità check_http; può gestire le pagine di accesso ed eseguire più passaggi in un controllo Nagios.


4

Trovo che check_nfsmount sia utile su molti dei miei server.

Modifica: voterei anche check_snmp se avessi il rappresentante per farlo. È in uso su tutti i miei server, oltre alla logica dietro check_hpjd che ho in esecuzione su tutte le mie stampanti HP.


4

Il mio più utile è quello che ho scritto io stesso che controlla i certificati SSL sui nostri server web in modo da poter tenere d'occhio la scadenza.


È pubblicato da qualche parte?
RainyRat,

4
check_http -H www.verisign.com -C 14
wittwerch,

4

PNP (pnp4nagios.org) - genera grafici in stile RRD per qualsiasi controllo Nagios che genera perf. dati. Incredibilmente utile, soprattutto quando si cerca di convincere gli sviluppatori che quel servizio appena installato è davvero la causa di tutti quei picchi di CPU ...


3

check_nt (parlare con NSClient o qualcosa di simile sull'argomento) consente di interrogare WMI su una finestra di Windows: se è presente un contatore delle prestazioni, ora è possibile monitorarlo con Nagios.


E puoi monitorare tutti i tuoi servizi in esecuzione, ad esempio verifica che Exchange o SQL Server siano in esecuzione
Simon Foster,

2

Questo è un po 'una spina spudorata, ma se stai monitorando i computer Windows usando NRPE, NagiosPluginsNT sembra funzionare abbastanza bene. ;-)


2

Concordo sul fatto che check_snmp sia un plugin estremamente prezioso; può essere usato per quasi tutti gli scopi e tutto ciò che appare in SNMP in generale. SNMP è disponibile su sistemi diversi come HP-UX, Tru64 e OpenVMS senza installazioni aggiuntive.

Un altro plugin (non proprio un) molto utile è NagiosGrapher; Ho la mia esperienza in un articolo che spiega di più, ma anche in modo che altri possano usarlo senza alcuna difficoltà che ho vissuto.

Un ultimo: NSCA. È possibile scrivere uno script Perl o Ruby o ksh e alimentare l'output in NSCA.

Tra le flessibilità di NSCA e SNMP combinate con la segnalazione di NagiosGrapher, questo dovrebbe espandere molto bene il monitoraggio.


2

Mi piace check_http per verificare che i miei siti Web funzionino ancora, l'ho ampliato per verificare che sia possibile trovare un determinato testo dopo che una volta la mia società di hosting ha deciso di pubblicare pagine vuote e i miei controlli nagios sono passati mentre il server era ancora in esecuzione.


2

Il più utile per me è quello che ho scritto per le mie esigenze: nagios-check-webpage

Scarica un'intera pagina con js / css / images, con multi-thread e gzip (salva molta banda con), come i veri navigatori.


+1 In effetti, quel plugin è fantastico. Usandolo per l'app. 4 mesi adesso.
Henk,

1

Il numero uno è NagiosWSC. Ti consente di monitorare senza agenti gli host Windows tramite WMI


senza agenti, ma con un unico grande punto di fallimento, ugh.
Toto

1

Uno che controlla la latenza effettiva per visualizzare i siti Web e lo scansiona per un tag nascosto "status: ok". Si è verificato un problema con la nostra cache di calamari e un problema di impostazione della lingua che si è verificato solo una volta ogni poche notti alle 3 del mattino quando qualcuno ha visitato il sito con un browser che ha richiesto una versione della pagina internazionalizzata in lingua turca.

Seriamente, imposta ogni tipo di monitoraggio che puoi. Gli strani bachi ed errori che è possibile rilevare in un ambiente complesso con un buon monitoraggio sono semplicemente sorprendenti. Inoltre, registra i tuoi dati sulle prestazioni in un database rrd e visualizzali in Cacti.


1

Uno dei plugin più importanti è quello che ho scritto da solo: check_rdiff_backup. Eseguo backup all'estero e Nagios mi dice se e quando succede qualcosa.

Se stai cercando un plug-in rdiff-backup, ce n'è uno che puoi trovare su Google.


1
Ne conosci uno per rsnapshot?
Rory,

1

check_curl per me è stata una manna dal cielo. Ho davvero fatto la differenza per la flessibilità con i controlli del sito Web e l'ho trovato molto più semplice del webinject, con quasi tutte le stesse funzionalità di cui avevo bisogno


1

Non strettamente un plugin, ma far funzionare twurl ( https://github.com/marcel/twurl ) come mezzo per attivare gli avvisi è stata una vera manna dal cielo. Non c'è bisogno di avvisi SMS e solo soddisfacente tutto intorno.

Dettagli su come è stato fatto: Nagios avvisa usando Twitter (con twurl) non sparando - scuse per l'autopromozione spudorata;)

Altre cose...

Check_diskio ( https://trac.id.ethz.ch/projects/nagios_plugins/wiki/check_diskio ) è stato incredibilmente utile in combinazione con il carico standard della CPU e i controlli del numero di processo nel determinare quando / se IO è associato e in che modo . L'uso di nagiosgraph ( http://exchange.nagios.org/directory/Addons/Graphing-and-Trending/nagiosgraph/details ) rende ancora più semplice.





0

Questo è un po 'imbroglione, perché ho fatto molti sviluppi su di esso, e in realtà controlla molte cose diverse contemporaneamente, ma il' plug-in ' nagios più utile per me è Resmon . È un agente che si esegue sul server stesso e nagios si connette su http per eseguire i controlli. Immagino sia simile a quello che fa nrpe, ma con diverse decisioni di progettazione.


0

Avevo usato due plugin .. uno era per fornire feed XML degli avvisi e l'altro per inviare avvisi via Twitter. Entrambi sono stati utili (a parte i normali plugin). se conti NRPE come plugin, aggiungi anche quello.


0

check_apt è davvero interessante e mi ricorda di aggiornare i miei server Debian.


0

Di recente ho iniziato a utilizzare il plug-in check_multi , utilizzando un NRPE con patch / avanzato per output di grandi dimensioni (a causa di HTML e informazioni sulle prestazioni).
È quasi "un plugin per domarli tutti"! ;-)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.