Sto usando i test Debian senza problemi per ~ 6 anni (lo sto solo aggiornando regolarmente), ma recentemente ha iniziato a mostrare un comportamento casuale che può essere riassunto come "Prestazioni di I / O basse che persistono fino al riavvio".
Il problema è che improvvisamente tutte le letture e le scritture del disco rallentano a ~ 5 MB / sec, il che si traduce in continue letture e scritture. Poiché la velocità è così bassa, i dischi non sono sottoposti a problemi meccanici o stressati, ma tutto rallenta fino al riavvio.
Il sottosistema I / O del computer è costituito da un SSD OCZ Vertex 3 e due HDD WD Caviar Black. SSD detiene parte pesante del sistema operativo e una partizione sull'HDD detiene il resto.
Per diagnosticare il problema ho provato quanto segue senza successo:
top
non mostra alcuna attività in fuga né nell'uso della CPU né dell'I / O.hdparm
restituisce le normali valutazioni delle prestazioni dei dischi (ho controllato solo-t
però).smartctl
non mostra alcun problema di prestazioni nei dischi. Test lunghi hanno dimostrato che i dischi sono come nuovi.
Il sistema ha un chipset Z77, 16 GB di RAM e CPU Intel i7 3770K e le statistiche non mostrano segni di saturazione in RAM, I / O o CPU, ma non ho esperienza di debug di problemi come questo (specialmente nello spazio del kernel). Qualsiasi aiuto sarà apprezzato.
Aggiornamento 1:
- Ho eseguito (forzato) fsck su ogni partizione per precauzione. Tutte le FS sono pulite.
- Per inciso ho trovato un aggiornamento del BIOS che è uscito un mese fa e l'ho applicato.
- Nessuna partizione è riempita per più del 50%.
Aggiornamento 2:
Il problema non si presenta per due giorni. L' fsck
aggiornamento del BIOS ha eliminato alcuni zoccoli nel sistema. Sto ancora monitorando il problema e chiuderò la domanda con una risposta post mortem.
Aggiornamento 3:
Il problema è riemerso e ho scavato un po 'di più. Vedi la risposta
noop
.
free
)
iowait
ecc se stai raccogliendo dati sar. Abiliterei sysstat
se non fosse già in esecuzione. Puoi controllare con la sar -A
maggior parte delle piattaforme intervalli di campionamento di dieci minuti.
atop
che ti direbbe quanto sono occupati i dischi (come quando cerchi sempre).