Ho un disco in un software RAID-1 a due dischi per il quale recentemente un "settore non correggibile offline" è apparso nello stato SMART.
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 1
Questo a quanto pare è solo un segno di un imminente guasto del disco se si verifica sempre più frequentemente (e poiché l'unità è speculare, non c'è nemmeno un grande rischio di perdita di dati reali). A quel tempo, un autotest fallì anche a un certo punto e smartd
mi mandò una e-mail per notificarmi come avrebbe dovuto.
Tuttavia, la scrittura nel settore danneggiato di solito fa sì che il disco utilizzi uno dei suoi settori di riserva invece che apparentemente ha fatto perché da quando ho dd
editato sul disco, tutti gli autotest hanno avuto esito positivo. E badblocks
inoltre non ha trovato motivo di lamentarsi.
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
[...]
# 5 Extended offline Completed without error 00% 5559 -
# 6 Short offline Completed without error 00% 5540 -
# 7 Short offline Completed: read failure 90% 5524 63273368
Il numero di settori difettosi non è diminuito, ma ciò non dovrebbe, in realtà, poiché il settore danneggiato è ancora lì, sebbene inutilizzato. Tuttavia, smartd
continua a inviarmi e-mail ogni notte:
The following warning/error was logged by the smartd daemon:
Device: /dev/sda [SAT], 1 Offline uncorrectable sectors
Questo è estremamente fastidioso ovviamente e intorpidisce il mio sano riflesso di panico alle smartd
mail.
Il disco è un Western Digital WD20EARS e la smartd
versione è 5.41 2011-06-09 r3365.
-U 198+
dovrebbe farlo. Bella scoperta!