Il punto degli attributi attuali / peggiori come la temperatura è esattamente questo: dirti se l'azionamento è mai stato al di fuori della sua massima temperatura operativa e quindi potrebbe aver subito danni permanenti.
Ecco perché dice "fallito in passato", non "fallire ora": hai appena toccato a malapena la soglia di temperatura massima. Si noti che la visualizzazione dell'attributo mostra "normalizzato: 50, soglia: 45, peggio: 45". (Questi sono 0..200 valori normalizzati come per qualsiasi altro attributo, non le temperature Celsius non elaborate.)
Hai anche alcuni settori danneggiati (errori di settore non corretti), quindi se la breve alta temperatura lo ha causato o meno, è probabilmente il momento di abbandonare quell'unità.
Una migliore interfaccia utente del software SMART ti mostrerà la temperatura attuale e massima . ad esempio
smartctl -a /dev/sda
o smartctl -x /dev/sda
(-x
stampa tutti i dati SMART e non SMART disponibili che può ottenere dall'unità, incluso un registro cronologico della temperatura se l'unità ne ha uno, con un grafico a barre ASCII.)
smartctl -x include questo per un vecchio disco rigido WD Green da 1 TB (WD10EADS):
Current Temperature: 36 Celsius
Power Cycle Min/Max Temperature: 25/42 Celsius
Lifetime Min/Max Temperature: 35/46 Celsius
Il software in uso sembra mostrare solo la temperatura corrente, che è leggermente al di sotto della soglia, ma non nasconderà il fatto che l'unità era fuori specifica a un certo punto in passato.
Potresti certamente giustificare ignorare quella momentanea alta temperatura, se davvero la correggessi in pochi minuti. Ma non sarai (o non dovresti mai) riuscire a far mentire l'unità stessa sul fatto che era oltre la sua temperatura massima nominale per qualche tempo, e quindi l'attributo non ha funzionato in passato.
È possibile configurare smartd
per ignorare qualsiasi attributo dato in modo da poter comunque ricevere una notifica utile se qualcos'altro supera una soglia in un territorio ufficialmente fallito. : smartd.conf(5)
dice:
-i ID [ATA only]
Ignora ID numero attributo dispositivo quando si verifica la presenza di errori negli attributi di utilizzo. ID deve essere un numero intero decimale compreso tra 1 e 255. La presente direttiva modifica il comportamento della direttiva "-f" e non ha alcun effetto senza di essa.
Ciò è utile, ad esempio, se si dispone di un disco molto vecchio e non si desidera continuare a ricevere messaggi sull'attributo ore-in-vita (in genere Attributo 9) in errore. La presente direttiva può apparire più volte per un singolo dispositivo, se si desidera ignorare più attributi.
Attributi cronologici di temperatura estesi
Ho appena ricevuto un nuovo Seagate Barracuda da 6 TB (firmware ST6000DM003-2CY186 0001, un drive da 5425 giri / min), che ha alcune statistiche interessanti, incluso il tempo trascorso a superare i punti operativi min / max, e il massimo / minimo delle temp a breve e log .
SCT Status Version: 3
SCT Version (vendor specific): 522 (0x020a)
Device State: Active (0)
Current Temperature: 33 Celsius
Power Cycle Min/Max Temperature: 27/33 Celsius
Lifetime Min/Max Temperature: 27/33 Celsius
Under/Over Temperature Limit Count: 0/0
SCT Temperature History Version: 2
Temperature Sampling Period: 3 minutes
Temperature Logging Interval: 59 minutes
Min/Max recommended Temperature: 14/55 Celsius
Min/Max Temperature Limit: 10/60 Celsius
Temperature History Size (Index): 128 (2)
E nella sezione di dettaglio completo:
0x05 ===== = = === == Temperature Statistics (rev 1) ==
0x05 0x008 1 33 --- Current Temperature
0x05 0x010 1 - --- Average Short Term Temperature
0x05 0x018 1 - --- Average Long Term Temperature
0x05 0x020 1 33 --- Highest Temperature
0x05 0x028 1 30 --- Lowest Temperature
0x05 0x030 1 - --- Highest Average Short Term Temperature
0x05 0x038 1 - --- Lowest Average Short Term Temperature
0x05 0x040 1 - --- Highest Average Long Term Temperature
0x05 0x048 1 - --- Lowest Average Long Term Temperature
0x05 0x050 4 0 --- Time in Over-Temperature
0x05 0x058 1 55 --- Specified Maximum Operating Temperature
0x05 0x060 4 0 --- Time in Under-Temperature
0x05 0x068 1 13 --- Specified Minimum Operating Temperature
(L'unità è stata accesa solo per un paio di minuti; questo è presumibilmente il motivo -
per cui in alcuni dei campi non è presente alcun dato.)
Se guidi ha questi attributi estesi, puoi mostrare a qualcuno che il tempo trascorso al di fuori della temperatura consentita è stato molto breve (in questo caso). Presumibilmente se avessi modificato i dati SMART, lo avresti fatto e non avresti mai menzionato il fatto che fosse fuori portata, ma ovviamente non puoi fidarti al 100% dei dati di un'unità di seconda mano che qualcuno sta cercando di venderti.
Vedi /superuser/1389522/what-does-it-mean-when-my-new-hdd-reports-errors-at-a-time-that-shouldnt-exist per ulteriori informazioni sulle unità usate con "rollback del contachilometri" sull'attributo "Power_On_Hours", ad esempio.