Come interpretare i risultati SMART dell'HDD?


58

Il mio laptop ha recentemente iniziato a diventare un po 'inaffidabile, e per qualche motivo ho iniziato a sospettare che il mio HDD stesse iniziando a fallire. Dopo un po 'di caccia su Internet, ho trovato l'Utility Disco di Ubuntu nel menu Sistema e da questo ho eseguito la lunga diagnostica SMART.

Tuttavia, poiché la documentazione per Utility Disco è molto scarsa ( palimpsest?), Non sono sicuro di come interpretare i risultati:

Valore oltre 50 milioni per un tasso di errore di lettura, ma il test è buono ?!

Ad esempio, il tasso di errore di lettura supera i 50 milioni (!), Ma il giudizio è valutato "Buono".

Qualcuno potrebbe spiegarmi come interpretare i risultati di questi test (in particolare i numeri Normalizzati, Peggiori, Soglia e Valore)? E forse dimmi cosa ne pensano dei risultati che ho ottenuto per il mio HDD? (Grazie)


"ECC hardware ripristinato" ha lo stesso valore di "Tasso di errore di lettura"? Il mio disco ha 676 cicli di accensione, è stato acceso per 285 giorni e ha 193 milioni di errori. Rispetto al mio, il tuo disco ha troppi errori, ma sto solo speculando qui. Ad ogni modo mi sono solo preoccupato di me
danizmax,

Sì, entrambi i numeri sono uguali!
Marty,

Risposte:


54

Hai una buona descrizione di come funziona SMART su wikipedia . Ma una breve introduzione:

  • Valore: questo è il valore grezzo riportato dal controller. Di solito è un valore di facile comprensione (come le ore di accensione o la temperatura), ma a volte non lo è (come il tasso di errore di lettura). Diversi produttori possono utilizzare strutture e significati diversi per questi dati.

  • Normalizzato: questo è il valore sopra normalizzato, quindi un valore più alto è sempre migliore. Quindi un 114 in tassi di lettura / errore è migliore di 113. Ancora una volta, il modo in cui il disco rigido converte i dati grezzi in valore normalizzato è specifico del fornitore.

  • Peggiore: il peggior valore normalizzato che l'unità ha avuto in passato (dove 99 è probabilmente l'impostazione di fabbrica).

  • Soglia: quando il valore normalizzato è inferiore a questo valore, è probabile che l'unità non riesca.

Quindi, il tuo disco rigido sembra essere a posto. Il valore del tasso di errore di lettura non è il tempo in cui l'unità si è guasta, ma alcune strutture di dati che dipendono dal produttore del disco.


se un determinato disco non sta segnalando un valore normalizzato , significa che il peggio e la soglia saranno riportati in termini o tutti gli azionamenti usano valori normalizzati e solo alcuni scelgono di etichettarli come solo "valore"?
DeveloperACE

25

Sì, generalmente il valore grezzo per il tasso di errore di lettura è senza senso. I valori che si desidera tenere d'occhio sono il conteggio del settore riallocato, il conteggio in sospeso e non modificabile offline. Quelli sono il conteggio dei settori danneggiati che sono stati, stanno aspettando di essere o non possono essere corretti, e i valori grezzi lì in genere hanno senso e sono il conteggio dei settori.

Se la lettura di un settore fallisce, diventa in sospeso. La prossima volta che si tenta di scrivere in quel settore, l'unità tenta di riscriverlo e, se funziona, tutto torna alla normalità. Se non riesce a scrivere correttamente il settore, riallocherà il settore dal pool di riserva. Se non può farlo (forse è già esaurito il pool di riserva?), Diventa offline_uncorrectable e prova a leggere o scrivere su di esso solo errori.


1
Ho un disco che praticamente non riesce a superare il tasso di errore di lettura non elaborato. Il test ha esito negativo solo dopo un periodo di funzionamento dell'unità, forse 15 minuti; sotto Windows il sintomo è che qualsiasi accesso all'unità blocca il processo, quindi sto usando gli strumenti di Ubuntu per determinare cosa è sbagliato, ma sono in perdita su ciò che sta dicendo è sbagliato con l'unità, poiché il tasso di errore di lettura non lo fa ' non sembra indicare alcun tipo di guasto imminente dell'unità, ma l'unità presenta sicuramente dei problemi!
Michael,

Vorrei anche aggiungere che i risultati dei test stessi sono ambigui. Il test complessivo dice che ha fallito, ma il test del tasso di errore di lettura, nonostante abbia un valore ridicolo (100/100, peggio, normalizzato) dice "Ok".
Michael,

9

psusi lo inchioda.

Se leggi le schede tecniche (white paper) su seagate.com vedrai come vengono realizzati, testati e come funzionano davvero gli HDD. Non esiste un HDD perfetto, mai stato, mai lo sarà (storia e fatti). Ai vecchi tempi, dovevamo inserire i settori danneggiati nel controller HDD da un elenco su carta che era arrivato nella nuova scatola dell'unità, quindi il controller li salta.

Le unità moderne hanno la correzione degli errori. Dal primo giorno i settori vanno male.

Quindi li mappano, questo significa che l'unità salta i settori danneggiati. In realtà sono "logicamente scambiati" - il settore danneggiato è mappato su un nuovo, buono, settore dei cilindri di riserva (ha cilindri di riserva - pensa ai cilindri come tracce). Tutto ciò è trasparente per il mondo esterno, ad eccezione dell'utilità SMART.

Ogni produttore può fare ciò che vuole, quindi alcuni impostano l'errore a zero, anche se potrebbero esserci 10 settori danneggiati non appena l'unità viene prodotta.

Nel firmware dell'unità è presente una regola 3 volte: legge un settore 3 volte e se tutte e 3 le volte è errato, può eseguire una "ricalibrazione" al volo e leggere altre 3 volte. Se l'unità non funziona ancora, assocerà quel settore a uno dei settori di riserva. Questo è profondo nel firmware, ma accade continuamente in background, tutto trasparente per l'utente.

Se il produttore sceglie di segnalare errori grezzi ogni volta che ci sono 3 letture errate o dopo che la calibrazione dipende da loro. Quindi, come dice sopra, non è importante a meno che tu non abbia molte unità dello stesso tipo e vedi alcune tendenze strane.

Punto 2: tutti gli HDD hanno errori di lettura naturali, puoi imparare anche su Seagate, se lo desideri. ma hanno tutti errori al volo. e vengono letti di nuovo e di solito superano il test per gli errori CRC. in caso contrario l'UNITÀ tenta di sostituirlo. se il disco si raffredda, durerà a lungo e molti non finiranno mai i cilindri di riserva. ma guarda come ti dice psusi!

Sto scrivendo questo, su un vecchio PC, con uno dei primi HDD da 1 GB mai realizzato. ed è ancora buono. (ho eseguito il backup) (nessuna mancanza di raffreddamento mai ...) il calore è il killer numero 1 e gli sbalzi di corrente, gestisco un UPS. salute e buona giornata. Spero che questo possa essere d'aiuto. (hai mai visto un disco rigido DatA General crash? e riempire la stanza con enormi quantità di lana di alluminio, spunti ricci? un sacco di divertimento allora ... mai un momento noioso ...

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.