Quando si installa munin, attiva un set predefinito di plugin (almeno su Ubuntu). In alternativa, puoi semplicemente eseguire munin-node-configure
per capire quali plugin sono supportati sul tuo sistema. La maggior parte di questi plugin tracciano dati diretti. La mia domanda non è di spiegare la natura dei dati (beh ... forse per alcuni) ma cosa cerchi in questi grafici?
È facile installare Munin e vedere grafici fantasiosi. Ma avere i grafici e non essere in grado di "leggerli" li rende totalmente inutili.
Elencherò i plugin standard che sono abilitati di default sul mio sistema. Quindi sarà una lunga lista. Per completezza, elencherò anche i plug-in che ritengo possano comprendere e fornirò una breve spiegazione di ciò che ritengo sia utilizzato. Motivo corretto se sbaglio con qualcuno di loro.
Vorrei quindi dividere questa domanda in tre parti:
- Plugin in cui non capisco nemmeno i dati
- Plugin in cui comprendo i dati ma non so a cosa dovrei cercare
- Plugin che penso di capire
Plugin in cui non capisco nemmeno i dati
Questi possono contenere domande che non sono necessariamente rivolte solo a Munin. Non comprendere i dati di solito significa una lacuna nelle conoscenze fondamentali sui sistemi operativi / hardware ....;) Sentiti libero di rispondere con una risposta "giyf".
Questi sono plugin in cui posso solo indovinare cosa sta succedendo ... Non voglio quasi guardare a queste "ipotesi" ...
- IO del disco per dispositivo (IO / secondo)
Che cos'è un IO. So che sta per input / output. Ma è così lontano. - Latenza del disco per dispositivo (attesa I / O media)
Non si sa quale sia un "I / O attesa" - Tempo di servizio IO
Questo è un gran casino ed è quasi impossibile vedere qualcosa nel grafico.
Plugin in cui comprendo i dati ma non so a cosa dovrei cercare
- IOStat (blocchi / seconda lettura / scritta)
presumo, la cosa da cercare qui sono i picchi? Ciò significherebbe che il dispositivo è in uso intenso? - Entropia disponibile (byte)
Presumo che questo sia importante per la generazione di numeri casuali? Perché dovrei rappresentare questo? Finora il valore è sempre stato pressoché costante. - VMStat (processi in esecuzione / I / O in sospensione)
Qual è la differenza tra questo e il grafico "processi"? Entrambi mostrano processi in esecuzione / inattività, mentre il grafico "Processi" sembra avere più dettagli. - Throughput del disco per dispositivo (byte / secondo letto / scritto)
Qual è la differenza tra questo e il grafico "IOStat"? - utilizzo della tabella degli inode
Cosa devo cercare in questo grafico?
Plugin che penso di capire
Indovinerò alcune cose qui ... correggimi se sbaglio.
- Utilizzo del disco in percentuale (percentuale)
Quanto spazio su disco viene utilizzato / rimanente. Poiché questo si avvicina al 100%, dovresti considerare di ripulire o estendere la partizione. Questo è estremamente importante per la partizione di root. - Velocità effettiva del firewall (pacchetti / secondo)
Il numero di pacchetti che attraversano il firewall. Se questo si verifica per un periodo di tempo più lungo, potrebbe essere un segno di un attacco DOS (o stiamo semplicemente ricevendo un file di grandi dimensioni). Può anche darti un'idea delle prestazioni del tuo firewall. Se si sta livellando e hai bisogno di più "potenza", dovresti considerare il bilanciamento del carico. Se si sta livellando e vedi una correlazione con il carico della CPU, potrebbe anche significare che l'hardware non è abbastanza veloce. Le correlazioni con l'utilizzo del disco potrebbero indicare destinazioni LOG eccessive nella configurazione FW. - errori eth0 (pacchetti in / out)
Errori di rete. Se questo valore aumenta, potrebbe essere un segno di hardware difettoso. - traffico eth0 (bit / secondo in / out)
Traffico di rete non elaborato . Ciò dovrebbe essere correlato alla velocità effettiva del firewall. - numero di thread
Un valore sempre crescente potrebbe indicare un processo che non chiude correttamente i thread. Indagare! - processi
Ripartizione dei processi attivi (incluso il sonno). Un rapido picco qui potrebbe indicare una bomba a forcella. Un valore lento ma sempre crescente potrebbe indicare un'applicazione che genera sottoprocessi ma non li chiude correttamente. Indagare utilizzandops faux
. - priorità del processo
Mostra la distribuzione delle priorità del processo. Avere solo processi ad alta priorità non è di grande utilità. Prendi in considerazione la priorità di alcuni. - utilizzo della cpu
Abbastanza semplice. Se si verifica un picco, è possibile che si verifichi un attacco o che un processo stia eseguendo il hogging della CPU. Se sta lentamente aumentando e si avvicina al massimo nelle normali operazioni, dovresti prendere in considerazione l'aggiornamento del tuo hardware (o il bilanciamento del carico). - utilizzo della tabella dei file
Numero di file aperti attivamente. Se questo sta raggiungendo il limite massimo, potresti avere un'apertura del processo, ma non rilasciare correttamente i file. - carico medio
Mostra un valore riepilogativo per il carico del sistema. Dovrebbe essere correlato all'utilizzo della CPU. Valori crescenti possono provenire da diverse fonti. Cerca correlazioni con altri grafici. - utilizzo della memoria
Una rappresentazione grafica della tua memoria. Finché hai molti buffer + cache + inutilizzati, stai bene. - swap in / out
Mostra l'attività sulla partizione di swap. Dovrebbe essere sempre 0. Se vedi attività su questo, dovresti aggiungere più memoria al tuo computer!