SMART è intelligente da usare?


16

Qualche anno fa mi è stato detto di evitare SMART come la peste. Il ragionamento era che lo stress che il test esercita sull'unità lo farà effettivamente fallire.

È ancora così? In caso contrario, qual è la frequenza ragionevole per eseguire i test? Se dovessi ancora evitarlo, qual è il modo migliore per monitorare la salute dei miei dischi rigidi?

Risposte:


30

Sebbene SMART non preveda certamente tutti i guasti, ho lavorato in un'officina di riparazione computer per diversi anni e molte volte un messaggio di errore SMART è stata la prima indicazione che stava per verificarsi un errore, permettendomi di salvare i dati del cliente prima dell'unità morto.

La stessa tecnologia non sollecita l'unità, ma tiene traccia di una serie di indicatori (elenco completo qui: http://en.wikipedia.org/wiki/SMART .) Che potrebbero potenzialmente portare a guasti dell'unità, come ad esempio:

  • Leggi il tasso di errore
  • Conteggio settori riallocati
  • Conteggio tentativi di centrifuga
  • Conteggio settoriale non correggibile
  • Ore di accensione

Le prestazioni di SMART sono trascurabili, non stressano le unità (il monitoraggio è passivo) e possono potenzialmente avvisarti che stai per perdere tutte le foto dei tuoi figli (o la tua collezione di MP3 o qualsiasi cosa sia importante sul tuo disco rigido ).

In breve, lascialo acceso.


Penso che il poster originale sia stato informato del pericolo di test attivi sulla superficie che possono essere eseguiti da SMART (eseguendo manualmente test "lunghi"). Bus come dici tu, per impostazione predefinita SMART è passivo e dovrebbe essere sempre abilitato. Personalmente eseguo anche test attivi una volta al mese sui miei dischi.
Colas Nahaboo,

3

Oltre a registrare passivamente i contatori delle prestazioni e gli eventi, SMART fornisce un'interfaccia per avviare diversi tipi di autotest eseguiti dall'unità e ottenere i risultati in un secondo momento.

Alcuni di questi test prevedono la scansione dell'intera superficie del piatto durante la permanenza online e la risposta alle richieste dell'host, quindi un I / O pesante causerà molta trebbiatura della testa.

Immagino che quest'ultimo sia la fonte del grave malinteso che ti è stato detto. SMART è carino.


-6

Qualche tempo fa Google ha realizzato uno studio (PDF) " Tendenze di guasti in una popolazione di unità disco di grandi dimensioni ". Hanno tonnellate di unità che utilizzano e lo studio ha dimostrato:

La nostra analisi identifica diversi parametri dalla funzione di automonitoraggio del convertitore (SMART) che sono altamente correlati ai guasti. Nonostante questa elevata correlazione, concludiamo che è improbabile che i modelli basati esclusivamente sui parametri SMART siano utili per prevedere i guasti dei singoli drive. Sorprendentemente, abbiamo scoperto che i livelli di temperatura e attività erano molto meno correlati con guasti dell'unità rispetto a quelli precedentemente riportati.

Quindi la temperatura è un fattore molto più grande quindi lo stress sull'unità. Inoltre, con tutta la correzione degli errori che si verifica in questa nuova unità PER SEMPRE, viene aggiunto molto più stress che non si ha il controllo. Se stai cercando uno strumento per fornire manutenzione (o ripristino) sulle tue unità, consiglierei SpinRite . È di Steve Gibson ed è un prodotto straordinario.


3
Il tuo riferimento non dice che la temperatura non è correlata al fallimento? ... ma la consideri un "fattore molto più grande"? Per favore, chiarisci cosa intendi
Michael Haren,

Sto leggendo quello sbagliato? Dice che la temperatura non è fortemente correlata al guasto dell'unità, giusto? Né è l'attività secondo quel documento.
MrChrister,

1
"Quindi la temperatura è un fattore molto più grande dello stress sul disco." - Da dove lo concludi? Il paragrafo che hai citato ha detto che la temperatura non era correlata in modo così elevato.
Joe Phillips,

3
-1 per non aver letto correttamente non solo l'abstract del documento, ma per non aver impiegato del tempo a leggere tutto. Il guasto dell'unità è generalmente dovuto a un difetto di fabbricazione (come mostrato nella Figura 3: l'elevato utilizzo nei primi 3 mesi elimina gli errori dei componenti - dopo che l'errore dovuto all'utilizzo inizia a convergere) o il degrado nel tempo. La degradazione nel tempo è ciò che SMART prenderà. La Fig. 5 mostra che la temperatura non è affatto un fattore importante, anzi il rapporto suggerisce che le unità più fredde hanno un cambiamento di guasto maggiore rispetto a quelle che funzionano a caldo, sicuramente entro i primi 3 anni.
Ian,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.