Se hai tempo, leggi Pinheiro et al (2007) Tendenze di errori in una popolazione di unità disco di grandi dimensioni. Atti della quinta conferenza USENIX sulle tecnologie di archiviazione e file, febbraio 2007 . Può essere recuperato da http://static.googleusercontent.com/external_content/untrusted_dlcp/labs.google.com/en//papers/disk_failures.pdf
In generale, le unità dello stesso produttore sono conformi alle stesse specifiche in termini di assemblaggio del disco. Di solito sono le tolleranze che differiscono. Per fare un esempio, se si desidera un cerchio di carta di 5 cm di diametro, un cerchio di 4,5 o 5,5 cm potrebbe essere accettabile per un uso (ad esempio uso domestico per la decorazione della stanza del bambino) ma un cerchio di 5,0 cm, aggiungere o sottrarre 1 mm ( cioè entro 4,9 - 5,1 cm) sarebbe necessario se si tratta di un progetto decorativo per il lancio di un progetto per qualche grande azienda.
Ad esempio, la specifica del ciclo di carico / scarico di un'unità domestica potrebbe essere ~ 300.000 volte, la specifica di carico / scarico di un'unità aziendale sarebbe ~ 600.000 volte, raddoppiando le cifre. Le specifiche più rigorose si applicano anche all'assemblaggio dell'unità e al processo di produzione del disco - e quindi il tasso di errore di lettura non recuperabile sarebbe molto più piccolo per le unità aziendali, ad esempio un'unità domestica tipica e attuale - Caviar Black (di Western Digital) avere un errore di lettura non recuperabile per 10 ^ 14 bit letti. Confronta con un tipico disco rigido prodotto per i server di data center WD RE SAS, che avrebbe un errore di lettura non recuperabile per 10 ^ 15 bit letti. Se questa affidabilità 10 volte più importante per te è un'altra questione.
Ad essere onesti, come si utilizza l'unità, è probabilmente più importante di quale unità si utilizza. Di seguito è riportato un riepilogo dei risultati di Google:
- Il 6-7% delle unità si guasta entro il primo anno di utilizzo. Entro il quale, oltre la metà di queste unità guaste fallirà entro 6 mesi. Queste unità tendono ad essere utilizzate molto durante questi periodi.
- Il guasto del convertitore segue un modello a doppio picco. Il primo picco è entro 3 mesi e il secondo picco è di circa 3 anni.
- Dopo il primo anno, c'è in generale un tasso di fallimento dell'8% di hard disk ogni anno.
- L'effetto della temperatura è duplice: [1] Il tasso di guasto più basso si osserva a dischi che si aggirano intorno ai 40 gradi C. [2] Con l'invecchiamento del convertitore, il tasso di guasto aumenta in modo esponenziale con la temperatura al terzo anno. Per interpretare questa affermazione, far funzionare l'unità a ~ 35 ° C otterrebbe il miglior compromesso tra longevità e guasti precoci, e se il tuo hard disk può essere sostituito ogni 2 anni, far funzionare le unità calde come 45C in generale ridurrebbe di fatto il tasso di guasto, ma dopo il secondo anno ci sarà un aumento esponenziale se lo farai a 45 ° C.
- Se si utilizza il software di report SMART (un bello è l'URL di informazioni sul disco di Crystal: http://crystalmark.info/software/CrystalDiskInfo/index-e.html ), se viene visualizzato un errore di scansione, il 10% fallirà in pochi giorni e Il 30% dell'unità non funzionerà entro 6 mesi. Pertanto, eseguire il backup e scartare l'unità di conseguenza dopo aver visualizzato il primo. Se vedi un evento di riallocazione, il 10% fallirà entro ~ 4 mesi. Si noti, tuttavia, che solo il 60% di tutti i guasti del disco rigido sarebbero previsti dal sistema SMART.
Aggiornare
MTBF
Il tempo medio tra i guasti non è sostanzialmente molto utile per i consumatori tipici. Il tempo medio tra fallimento è di solito ideale e teorico . Supponiamo di avere 500.000 unità con MTBF di 500.000 ore: se eseguirai tutte insieme, lo farairischia di avere uno di questi che si guasta ogni ora, statisticamente parlando, se li esegui secondo le loro specifiche (temperatura, umidità, qualità dell'alimentatore ...) Con riferimento allo studio di Google, la vita utile realistica di un hard disk sarebbe più simile 2 anni (in un sistema non ridondante) o 3 anni (in un sistema ridondante) - se lo si utilizza 24 ore al giorno - In un sistema ridondante (ad esempio un RAID- [5,6]) si può perdere un hard disk senza perdita di dati. In particolare, in RAID 6 puoi perdere un hard disk e avere ancora ridondanza durante il processo di ricostruzione.
Durata utile
Uno spesso vede alcuni produttori che citano una durata di servizio come '5 anni' e quindi offrono una garanzia di '3 anni'. Traduzione: "Riteniamo che dovrebbe durare circa 5 anni. Se fallisce entro i primi tre anni di utilizzo, lo sostituiremo a nostre spese, ma se hai fallito tra il 3 ° e il 5 ° anno, povero te. Certamente non sarà il caso che abbiamo installato una sorta di bomba a orologeria per renderle inutilizzabili entro il suo quinto compleanno, ma dovresti ottenere un nuovo disco rigido e utilizzare al posto di questo disco rigido di 5 anni se i tuoi dati sono preziosi. "
Ecco come lo definiscono come ho capito.
Ultimo ma non meno importante, prova a leggere il documento di Google, è un'ottima lettura.