Ultimamente, ho dovuto affrontare alcuni tempi di inattività in alcuni dei siti Drupal che ho implementato. Vorrei affrontare il problema in modo proattivo, piuttosto che reagire a quei tempi di inattività riavviando i servizi o il server stesso. Ho letto su strumenti di monitoraggio come nagios, munin, cactus, ecc. Per monitorare lo stato del tuo server / infrastruttura, ma non ne ho mai provato uno in produzione. Mi occupo di Drupal quasi il 99% delle volte e vorrei trovare suggerimenti sia per il monitoraggio a livello di server sia per il monitoraggio a livello di Drupal (codice applicazione).
Fondamentalmente, vorrei essere avvisato quando il carico del server è elevato, probabilmente indicato al colpevole (o alla vittima), in modo da poter prendere decisioni informate. Vorrei anche sapere cosa usano le persone per il monitoraggio del livello di Drupal (come l'invio di e-mail) in caso di errore / avviso PHP. (Cosa succede quando lo stesso server di posta elettronica è inattivo?)