Verificare la presenza di errori del disco rigido / segni di errore sul server CentOS


14

Qual è il modo migliore per verificare la presenza di errori dell'HDD e i primi segni di guasto su CentOS?


1
quanto frequenti dovrebbero essere i controlli? tutti i giorni - settimanalmente?
Inac,

Risposte:


3

Consiglierei l'installazione di smartmon ( http://sourceforge.net/apps/trac/smartmontools/wiki ) sul tuo computer, questo è un software che può controllare lo stato dei tuoi dischi, altrimenti controllerà / var / log / messages o / var / log / syslog per qualsiasi menzione di errori scsi


sembra che smartmon, sebbene le sue statistiche menzionino che catturerebbe solo il 60% delle unità guaste .. Se imposto smartmon per eseguire la scansione quotidianamente, questo aiuterebbe effettivamente l'hdd a morire più velocemente - è un Seagate 7200.10?
Inac,

@inac smartmon aiuterà gli HDD a morire più velocemente? Dove hai letto questo? Si prega di aggiungere un URL.
030,

2
dmesg

Il kernel registrerà tutti i messaggi diagnostici sui dispositivi I / O, in modo da poterli controllare con il comando dmesg.


ma dovresti eseguire questo dump di dmesg dumpg manualmente o cronjob a vi?
Inac,

o. potresti creare uno script per scaricarlo con "dmesg> dmesg.dump.txt" ed eseguirlo quotidianamente con cron.
Banjer,

1

È possibile eseguire fsck sul dispositivo per verificare la presenza di errori.


0

Come dice Paul, i registri SMART sono un buon posto da controllare.

Consiglierei anche di eseguire BadBlocks . Se hai una scheda RAID, potresti dover usare il monitoraggio su quella.


0

Il monitoraggio SMART è un buon metodo. Come root, smartctl -a /dev/hdadove hda è l'unità che desideri ... potrebbe essere hdb, sda, ecc. Consiglia anche di impostare il tuo indirizzo e-mail in / etc / alias come persona che dovrebbe ricevere la posta di root.

Questa è una risposta molto vaga però. Se si dispone di un server creato da uno dei grandi produttori (Dell, HP, ecc.), È probabile che siano disponibili migliori capacità di monitoraggio.


0

Puoi provare il controllo completo della partizione / dev / sda1 (ad esempio) come

fsck -f /dev/sda1

oppure, prova il test completo non descrittivo in scrittura / lettura di una determinata partizione

badblocks -vn /dev/sda1

/dev/sda1 is mounted; it's not safe to run badblocks!
030,

e2fsck: Cannot continue, aborting.
030,

@ 030 Passa a un runlevel in cui il disco principale non è montato.
Awiebe,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.