Strategie di monitoraggio per l'infrastruttura


12

Ultimamente, ho dovuto affrontare alcuni tempi di inattività in alcuni dei siti Drupal che ho implementato. Vorrei affrontare il problema in modo proattivo, piuttosto che reagire a quei tempi di inattività riavviando i servizi o il server stesso. Ho letto su strumenti di monitoraggio come nagios, munin, cactus, ecc. Per monitorare lo stato del tuo server / infrastruttura, ma non ne ho mai provato uno in produzione. Mi occupo di Drupal quasi il 99% delle volte e vorrei trovare suggerimenti sia per il monitoraggio a livello di server sia per il monitoraggio a livello di Drupal (codice applicazione).

Fondamentalmente, vorrei essere avvisato quando il carico del server è elevato, probabilmente indicato al colpevole (o alla vittima), in modo da poter prendere decisioni informate. Vorrei anche sapere cosa usano le persone per il monitoraggio del livello di Drupal (come l'invio di e-mail) in caso di errore / avviso PHP. (Cosa succede quando lo stesso server di posta elettronica è inattivo?)

Risposte:


6

Se vuoi monitorare diversi siti Drupal dallo stesso posto con avvisi, ecc ... Posso dire che non sei l'unico. Sta iniziando a diventare una nicchia aziendale, ormai riempita da:

Entrambi sono approcci SaaS commerciali, con opzioni limitate gratuite per provare il servizio.

Inoltre c'è l' opzione di monitoraggio Open Source Zabbix con il suo modulo Drupal http://drupal.org/project/zabbix , ma poi dovresti configurare e costruire te stesso il server.

Tutte queste opzioni hanno i loro moduli Drupal per inviare al server monitor informazioni specifiche del server e drupal.

AGGIORNARE. Munin ha anche un modulo Drupal specifico , con un ramo 2.x basato su Drush.


Ho provato una nuova reliquia con Drupal e devo dire che è davvero estesa in un buon modo il più delle volte (xhprof più o meno è un buon sostituto delle tracce di transazione in NR ma la raccolta dei dati è indespensabile). Ho anche sentito parlare di drupal.org che ha adottato i nagios per il monitoraggio. Grazie per la risposta, aspetterò un paio di giorni in più per un paio in più prima di selezionarlo.
Dipen,

5

Indipendentemente da quale usi, l'unica cosa che suggerirei sicuramente è, a meno che tu non abbia uno staff IT a tempo pieno, di non mantenere il tuo monitoraggio: affidati a un servizio completamente indipendente dai tuoi server. Una cosa è avere un server pubblico rivolto verso il basso, un'altra è averlo spento e non saperlo perché anche il tuo server di monitoraggio è inattivo. La maggior parte dei servizi di monitoraggio includerà tutti i requisiti che hai elencato fuori dalla scatola.

Ma a rischio che questo si trasformi in una domanda di raccomandazione per lo shopping, il servizio che utilizzo per i requisiti che hai elencato è Pingdom :

  • Ti dice se un sito attivo (ovviamente)
  • Misura il tempo necessario per rispondere
  • Misura la reattività e la disponibilità su qualsiasi porta TCP / UDP personalizzata
  • Verifica disponibilità e-mail
  • Consente richieste HTTP personalizzate, permettendoti di testare diversi aspetti della tua applicazione
  • Rapporti approfonditi
  • Monitoraggio mondiale e aggiungono circa una dozzina di siti di monitoraggio ogni pochi mesi

Sto già utilizzando site24x7.com e anche pingdom (per un sito diff) per gli avvisi, volevo un monitoraggio che mi parlasse in modo proattivo dell'utilizzo delle risorse o di potenziali problemi e si integrasse strettamente con l'ambiente server. Grazie per la tua risposta.
Dipen,

2

Questi sono alcuni suggerimenti agnostici Drupal:

  • Are My Sites Up eseguirà periodicamente il ping dei tuoi server e ti invierà un'e-mail (o SMS se ricevi il pacchetto non gratuito) se il tuo sito è offline o non risponde.
  • Load Impact è un altro ottimo strumento gratuito in grado di sottoporre a stress il tuo sito Web in modo da poter sapere esattamente quando inizia a fallire.

Per quanto riguarda l'applicazione Drupal stessa, suggerirei di utilizzare Xdebug + Webgrind o XHProf per profilare il codice e tenere d'occhio questa domanda: Il modo migliore per confrontare le prestazioni dello stack Drupal


Grazie per avermi informato sull'impatto del carico, sto usando jmeter ma poi è più impegnativo impostare i tuoi piani di test, ecc. Spero che l'impatto del carico possa gestire simulazioni autenticate da drupal.
Dipen,

1

Mi piace il pingdom per i siti di piccole / medie dimensioni perché è utile: ti dice che Something Is Wrong dal punto di vista del cliente, che è utilizzabile. Cose come il carico medio non significano davvero nulla a meno che tu non abbia uno stack selvaggiamente configurato (cosa che non dovresti) o che non vieni martellato da Digg / Reddit (nel qual caso non c'è niente che puoi fare comunque, dovresti preparato).

Dal blog di Ted Dziuba:

Chiamo questi tipi di avvisi Cool Story, Bro in breve. Queste sono parti di informazioni che non indicano alcun tipo di stato del problema e non richiedono alcuna azione. Le storie interessanti sono cose per le quali non dovresti nemmeno avere avvisi. Perdono tempo e ti rendono paranoico. Gli avvisi di Cool Story Bro sono cose come:

  • La media del carico su un server è superiore a 20.
  • Una coda lavori contiene più di X unità di lavoro. Congratulazioni, dipshit, la tua coda sta facendo esattamente quello che dovrebbe fare.
  • Una certa metrica è maggiore di una media determinata empiricamente. Mi offendo personalmente di merda come questa.

Leggi il post sul blog, è divertente.


0

Sto usando check_drupal per monitorare vari siti di drupal. Questo è un plug-in nagios che non richiede alcuna modifica del codice a un sito drupal stesso. L'unico requisito è che drush deve essere presente sul server.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.