Ho usato munin su più server per molti anni con grande successo, tuttavia con più di 100 nodi munin e quando c'è carico sui client, l'elaborazione sta scadendo.
Ho apportato alcune modifiche al ridimensionamento del processo cron e al numero di processi client e ridotto il numero di plugin in esecuzione ecc., Ma ho deciso di cercare un'alternativa con un'architettura più scalabile.
Eventuali suggerimenti o esperienze sarebbero i benvenuti. Sono sostanzialmente interessato alle metriche del server che possono essere utilizzate per pianificare la capacità e diagnosticare l'utilizzo delle risorse. (abbiamo nagios per avvisare)