Qual è la durata di un tipico disco rigido? [chiuso]


22

Che durata ci si può aspettare dal tipico disco rigido? O ci sono grandi differenze tra i diversi tipi? E fa la differenza se viene utilizzato pesantemente anziché non essere mai connesso al sistema (ad esempio come supporto di backup)?


Misure di durata e affidabilità per dischi rigidi: github.com/linuxhw/SMART/blob/master/README.md
linuxbuild

Risposte:


22

Che durata ci si può aspettare dal tipico disco rigido?

La risposta corretta alla tua domanda di "Che durata ci si può aspettare dal tipico disco rigido?" è "Non abbastanza per non avere un backup dei dati dal primo giorno".

Scherzi a parte, la maggior parte dei tecnici da secoli immemorabili hanno sentito l'improvviso bisogno di esaurirsi e acquistare un disco rigido sostitutivo entro 3 anni. C'è stato un ottimo white paper di Google sulla durata delle unità SATA a livello di consumatore ed è stato spaventoso leggere, per non dire altro.

Ci sono grandi differenze tra i tipi?

Abbiamo avuto SCSI, SAS, IDE, SATA, ecc. Inoltre, ora abbiamo modelli Enterprise, con capacità 24/7, ecc. Ecc. Solitamente, le aziende (modelli SCSI, SAS, Enterprise) dovrebbero avere una durata maggiore ... tuttavia ci sono ancora alcune uova cattive che scivolano attraverso i cancelli e si precipitano verso l'abisso del fallimento.

Fa differenza se viene usato pesantemente?

Un disco rigido che non viene spesso utilizzato in teoria dovrebbe durare più a lungo di un disco costantemente utilizzato, tuttavia non considerarlo come la verità del Vangelo.

Allora, cosa stai cercando di dire qui, ragazzo desideroso?

Quello che sto cercando di dire è che, quando si tratta di archiviazione di dati e dati, non è mai troppo stravagante supporre che l'unità si guasterà domani - e pianificare in base a ciò.


9
A volte vale anche la pena ipotizzare che l'unità non sia riuscita ieri e non te ne sei accorta ;-)
Joachim Sauer,

5
+1 per la paranoia. Supponiamo sempre che un'unità possa guastarsi nei prossimi minuti, perché potrebbe. Avere un buon regime di backup per i dati che ti interessano e se l'alta disponibilità è una sorta di accordo RAID con più unità per garantire la resilienza dei dati di fronte a determinati guasti fisici.
David Spillett,

Quel white paper di Google è stato un'ottima lettura, per quanto ricordo. Non spaventoso, davvero. Mi aspettavo di peggio:] È stato abbastanza sfortunato sperimentare quella "mortalità infantile" una volta. Avere un piano di backup adeguato da quel giorno:]
Kirill Strizhak,

SpinRite aiuta sempre, se eseguito ogni pochi mesi, a tenere d'occhio le prestazioni dell'unità. Non lo faccio personalmente, ma poi ho iniziato a eseguire il backup dei miei dati solo un paio di settimane fa ^ - ^
RCIX

Per aggiungere qualcosa a questa risposta (anche se la domanda è chiusa): dovresti guardare quante volte il tuo disco rigido si spegne. Spegnerli e riaccenderli è un enorme punto di errore.
Apache,


5

Ciò che abbiamo sono solo prove statistiche per un periodo di tempo relativamente breve (da 3 a 5 anni al massimo). Non possiamo necessariamente dedurre l'aspettativa di vita delle unità attuali da quelle vecchie o di una unità particolare da un'altra. Alcuni aneddoti:

  • Ho circa 20 anni di dischi rigidi (da 40 a 400 MB) che funzionano perfettamente oggi.
  • uno dei miei clienti ha un array RAID di 4 unità da 320 MB in esecuzione 24 / 24h dal 1993 senza alcun errore finora.
  • d'altra parte, l'80% delle unità Micropolis da 9 GB vintage del 1996 fallì nel primo anno.

Tuttavia :

  • la tecnologia di azionamento è cambiata in modo molto significativo negli ultimi 15 anni. Non scommetterei che le unità attuali si avvicinano alle unità più vecchie (e più semplici) dal punto di vista della durabilità, anche se in media potrebbero andare meglio .
  • su un ampio campione, i tassi di guasto attuali delle unità sono circa dallo 0,6 all'1% all'anno per i 5 anni a cui i produttori di unità sono interessati. Dopo questi cinque anni, i dati effettivi sono scarsi.

Informazioni sull'uso del disco:

  • La maggior parte dei nostri server di archiviazione rientra nell'intervallo dello 0,6% dei guasti annuali dell'unità (dati raccolti su circa 3000 dischi).
  • ma un cluster particolarmente utilizzato (in totale 300 dischi) è compreso tra il 3 e il 5% di tasso di errore del disco (da 5 a 10 volte peggiore).

Cosa fare?

  • Usa RAID. Esegui backup. Conserva alcuni backup su qualche altra tecnologia (nastro, ottica). Fai più backup. Poi ancora un po '. Solo i paranoici sopravvivranno.

2
amen :).
Kirill Strizhak,

4

fa la differenza se viene utilizzato pesantemente invece di non essere mai collegato al sistema?

Questo punto è l'unico finora non coperto da altre risposte.

Un azionamento in uso vedrà una maggiore usura dei meccanismi fisici (ad esempio l'apparato di spostamento della testa e il motore del mandrino) ed è esposto a condizioni ambientali (ad esempio variazioni della temperatura di funzionamento all'interno di una macchina e una maggiore possibilità di colpi fisici se si tratta di un'unità esterna).

Tuttavia, i supporti inattivi possono comunque deteriorarsi nel tempo. I cambiamenti nell'ambiente (principalmente la temperatura per i dischi rigidi, l'umidità anche per i nastri) possono causare un lento degrado della memoria magnetica così come l'esposizione ad altri fattori di conservazione (campi magnetici locali, contaminanti temporanei o meno, nell'aria, ...). Inoltre potresti scoprire che un'unità che è stata spenta per un lungo periodo di tempo non riuscirà a girare una volta ricollegata a causa del "grippaggio" di parti meccaniche - ci sono tecniche che a volte salvano un'unità da così tanto tempo i dati vengono trasferiti su un'altra unità ma non sono affidabili. In questo modo ho avuto solo un guasto a un disco e sono riuscito a farlo funzionare con la rischiosa tecnica del "giro veloce", ma succede. Quindi, se stai memorizzando i dati sulle unità per molto tempo,


3

Il più grande assassino è la temperatura. Mantieni i tuoi dischi rigidi al di sotto di 30 gradi C. Il prossimo killer più grande è lo shock, o facendo cadere fisicamente il disco o quello che è noto come un "crash di testa" in cui il cantilever gratta contro il rivestimento magnetico dell'unità a causa di un guasto di alimentazione o meccanico .

L'MTBF (tempo medio prima del guasto) è un'indicazione approssimativa della durata di un azionamento (in media) indipendentemente dal carico e viene generalmente fornita dal produttore, sebbene lo prenda con un pizzico di sale.


2
Prendi i valori MTBF dei produttori con tutto il sale nel Mar Morto. Se fossero accurati, avremmo dischi rigidi che durano almeno 30 anni.
Caliban,

1
MTBF è proprio questo. "significare". Una media. Alcune unità sopravvivranno per oltre 30 anni e altre dureranno cinque minuti, senza invalidare la media. Inoltre ci sono avvertimenti con qualsiasi MTBF (di solito nella piccola stampa da qualche parte) come quanti cicli di potenza e cicli di spin-up / spin-down sono assunti in un determinato periodo di tempo e il fatto che l'MTBF presupponga condizioni perfette che nessun azionamento esperienze per tutta la sua vita nel mondo reale.
David Spillett,

Il consiglio sulla temperatura è errato secondo uno studio di Google : "Contrariamente ai risultati precedentemente riportati, abbiamo trovato una correlazione molto bassa tra i tassi di fallimento e livelli elevati di temperatura o attività".
Emily L.
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.