Sto cercando un modo per diagnosticare problemi, come la morte degli swap, in cui un processo di memoria balooning riempie lo swap e uccide l'intera macchina (come apache).
Sto già utilizzando cactus e posso installare nagios (anche se preferirei non farlo) o munin, ma per quanto ne so non possono registrare l'utilizzo del singolo programma - solo lo stato generale.
So di poter eseguire il rollup di uno script che >> su un file ogni 30s, ma mi piacerebbe vedere se esiste già una soluzione matura esistente.
Ancora una volta, idealmente dovrebbe:
- registra l'utilizzo della memoria dei processi ogni N secondi
- registra l'utilizzo della CPU dei processi ogni N secondi
- grafici di supporto e cronologia
- medie di supporto - come mysqld ha utilizzato il 43% di CPU nell'ultimo giorno e una memoria media di 400 MB
- essere libero e open source
I nomi dei processi non sono e non dovrebbero essere conosciuti in anticipo: l'idea è di lasciarlo monitorare e quindi dare un'occhiata ai principali autori di reato.
Il mio sistema è Linux (OpenSUSE).