Come far tacere la smartd su un particolare settore non correggibile offline?


18

Ho un disco in un software RAID-1 a due dischi per il quale recentemente un "settore non correggibile offline" è apparso nello stato SMART.

198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       1

Questo a quanto pare è solo un segno di un imminente guasto del disco se si verifica sempre più frequentemente (e poiché l'unità è speculare, non c'è nemmeno un grande rischio di perdita di dati reali). A quel tempo, un autotest fallì anche a un certo punto e smartdmi mandò una e-mail per notificarmi come avrebbe dovuto.

Tuttavia, la scrittura nel settore danneggiato di solito fa sì che il disco utilizzi uno dei suoi settori di riserva invece che apparentemente ha fatto perché da quando ho ddeditato sul disco, tutti gli autotest hanno avuto esito positivo. E badblocksinoltre non ha trovato motivo di lamentarsi.

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
[...]
# 5  Extended offline    Completed without error       00%      5559         -
# 6  Short offline       Completed without error       00%      5540         -
# 7  Short offline       Completed: read failure       90%      5524         63273368

Il numero di settori difettosi non è diminuito, ma ciò non dovrebbe, in realtà, poiché il settore danneggiato è ancora lì, sebbene inutilizzato. Tuttavia, smartdcontinua a inviarmi e-mail ogni notte:

The following warning/error was logged by the smartd daemon:

Device: /dev/sda [SAT], 1 Offline uncorrectable sectors

Questo è estremamente fastidioso ovviamente e intorpidisce il mio sano riflesso di panico alle smartdmail.

Il disco è un Western Digital WD20EARS e la smartdversione è 5.41 2011-06-09 r3365.

Risposte:


23

Su alcuni dischi, potrebbe essere necessario ricorrere a -U 198+(o -U +?) Nel file di configurazione.

Fate attenzione. Se non sei il richiedente originale, leggi attentamente l'intera domanda. Se lo usi su un disco che non ne ha bisogno, sopprimerà gli avvisi completamente validi.

Se si specifica ´ + ´, un rapporto viene stampato solo se il numero di settori è aumentato dall'ultimo ciclo di controllo. Alcuni dischi non ripristinano questo attributo quando viene riallocato un settore danneggiato. Vedi anche ´-v 198, crescente´ di seguito.

smartd.conf (5)

Ad esempio, supponiamo di utilizzare la configurazione predefinita in smartd.conf. In tal caso, ci sono molti commenti nel file, ma l'unica riga di non commento è qui:

# The word DEVICESCAN will cause any remaining lines in this
# configuration file to be ignored: it tells smartd to scan for all
# ATA and SCSI devices.  DEVICESCAN may be followed by any of the
# Directives listed below, which will be applied to all devices that
# are found.  Most users should comment out DEVICESCAN and explicitly
# list the devices that they wish to monitor.
DEVICESCAN

Aggiungi l'opzione alla fine della riga:

DEVICESCAN -U 198+

1
-U 198+dovrebbe farlo. Bella scoperta!
Michael Hampton,

qualche esame per questo?
JIV

1
@JIV modificato. Ho anche aggiunto un avviso. Ti preghiamo di prestare la massima attenzione ai tuoi dati :-).
FonteJedi

0

ci sono due possibilità da dove provengono queste mail. smartd è in grado di inviare e-mail da sola, ma molto probabilmente non è configurato in questo modo, quindi presumo che queste e-mail vengano inviate tramite logcheck. Se questa ipotesi è errata, non è necessario leggere oltre.

logcheck esegue la scansione dei file di registro e invia e-mail se ritiene che dovresti preoccuparti di tutto ciò che è successo al / sul tuo sistema.

Hai la possibilità di scrivere una regola ignora logcheck che dice a logcheck di non inviare messaggi che corrispondono a un modello specifico.

Potresti (sotto i sistemi basati su Debian) creare un file chiamato "/etc/logcheck/ignore.d.server/smartd_own" con il seguente contenuto:

^\w{3} [ :0-9]{11} [._[:alnum:]-]+ smartd\[[0-9]+\]: Device: /dev/sda \[SAT\], 1 Offline uncorrectable sectors$

Questo dovrebbe filtrare le fastidiose mail ma riscriverti se aumenta il contatore dei settori non corretti.


smartdinvia i messaggi direttamente, purtroppo. Apparentemente è sempre un'opzione per cambiare questo però. Lo prenderò in considerazione se non ci fosse altro modo, quindi grazie!
Christian,

Oh maledizione, comunque hai una soluzione alternativa ora.
Hennr,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.