Monitoraggio del server di produzione [chiuso]


18

Abbiamo 3 server dedicati, suddivisi in diversi VPS usando openVZ. Stiamo usando Munin per monitorare il VPS con i siti di produzione e monitiamo su alcuni dei VPS per assicurarci che riavvii il servizio in caso di guasto.

Il fatto è che abbiamo bisogno di un modo molto migliore per monitorare tutti i nostri server, poiché abbiamo fino a 14 VPS, vorremmo avere un hub centrale in cui potremmo vedere non solo i dati raccolti da Munin, ma anche alcune statistiche extra sulle reti e le prestazioni dei nostri servizi.

Alcuni dei nostri requisiti:
- Notifica SMS in caso di errore (possibilità di impostare determinate verifiche personalizzate)
- Analizzatore di log per apache error_log e alcuni altri.
- Deve essere centrale (ovvero un server e diversi nodi che raccolgono i dati).
- Non deve essere facile da installare ma facile da mantenere.
- Deve essere libero

Sono stato segnalato a nagios e splunk, cosa ne pensi? Grazie,

Risposte:


17

Ho una configurazione simile, tranne con Xen sul posto. Sono stato molto contento di una combinazione di:

  • Nagios per gli avvisi (utilizzando PNP per alcuni grafici lite e Nagviz per un dashboard dello stato del servizio)
  • Gangli per la rappresentazione grafica storica dei sistemi
  • OSSEC come HIDS e altrettanto importante come raccoglitore per la registrazione centralizzata
    • sidenote: Esiste un plug-in Splunk per OSSEC che integra molto bene questi due strumenti , sto aspettando che li portino su Splunk v4.
  • Splunk Infine, una volta migrati alcuni plug-in Splunk, prevediamo di utilizzare Splunk con alcuni pre-filtri dei log (per evitare di passare oltre il limite delle edizioni gratuite)

Spero che condividere la nostra configurazione di monitoraggio ti aiuterà :-)

Ecco alcuni link utili:

http://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-1/index.html

https://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-2/

http://www.ossec.net/main/splunk-ossec-integration

aggiornare:

Ho dimenticato di menzionare che utilizziamo anche il layout di configurazione di Matt Simmons Nagios, disponibile qui http://www.standalone-sysadmin.com/blog/2009/07/nagios-config/

Questo layout ha reso la nostra configurazione Nagios sana e molto più facile da mantenere (Grazie Matt!)


2
+1 per OSSEC + splunk. lavorano molto bene insieme.
sucuri,

5

Ho avuto un grande successo con Zabbix , soddisfa tutti i tuoi punti in un pacchetto.

testo alternativo
(fonte: zabbix.com )

La parte più difficile sarà ottenere il monitoraggio del log di Apache, ma Zabbix è estensibile, quindi puoi usare LogWatch o qualche altro script perl per prendere i dati per te.


2

Mi piace OpManager, ed è gratuito fino a un certo numero di nodi. Fa tutto quanto sopra ed è abbastanza facile da installare e mantenere.


1

Nagios dovrebbe essere una buona scelta. Prima di tutto: è modulare e soddisfa praticamente tutte le tue aspettative. Inoltre, ha ricevuto alcuni bei premi .

EDIT: non dimenticare di controllare questa risposta .

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.