Che tipo di manutenzione periodica devo eseguire sul backup dell'HDD?


15

Ho un sacco di directory di cui è stato eseguito il backup su un HDD esterno - non un SSD, un disco magnetico.

Il backup è solo su un singolo disco (sì, lo so, un HDD extra con una copia sarebbe una buona idea; ma non è il caso in questo momento). Inoltre, non ci sono doppie copie dei file sul disco.

L'HDD ha (opzione 1) molto più spazio rispetto ai miei file (opzione 2) meno spazio libero rispetto ai miei file (ma comunque una buona quantità)

Conservo il disco nella sua confezione originale: busta di plastica, all'interno di un "cartone per uova" come una confezione, all'interno della scatola di plastica. È tenuto in una stanza di casa mia con la scatola mai esposta al sole, né alla pioggia, ecc.

La mia domanda è: c'è qualcosa che dovrei fare periodicamente con il disco per massimizzare la longevità dei dati? ad es. leggere tutto da qualche altra parte, o leggere e riscrivere, o rimescolare le posizioni fisiche dei dati sul disco in qualche modo, o persino scuotere il disco, cambiarne la posizione fisica, accenderlo senza fare nulla, ecc. ecc. Vorrei una risposta per entrambi gli scenari opzionali che ho descritto.

Appunti:

  • Preferirei non rendere questa domanda specifica per un singolo marchio di HDD, ma se devi saperlo - è un disco Toshiba STOR.E di base da 750 GB. Non è una mia scelta, devo solo lavorare con questo.
  • Il manuale dell'HDD non dice nulla su questo problema.
  • Il backup rappresenta lo stato di queste cartelle in passato. Supponiamo che sia importante mantenere lo stato così com'è e che non esiste una "copia master" degli stessi dati.
  • Sebbene sia probabilmente irrilevante per la domanda, non è catastroficamente negativo se questi file vengono persi, vorrei solo aumentare la longevità prevista.
  • anche se avessi avuto due copie, su due HDD, la domanda sarebbe altrettanto rilevante: che tipo di operazioni di manutenzione dovrei fare su ciascuna di esse separatamente?

La lettura periodica dei file per "migliorare" il campo magnetico che rappresenta i dati sarebbe una buona idea. L'uso di un filesystem che aggiunge un po 'di automazione / protezione aggiuntiva a questo renderebbe un po' più facile. Ovviamente sarebbe preferibile avere più dispositivi multimediali con gli stessi dati. Il manuale non dice nulla al riguardo in quanto è uno scenario insolito utilizzare gli HDD come memoria offline (immagino).
Seth,

4
Le risposte sembrano basate sull'opinione e sulla pratica comune. Non vedo risposte solide, basate sulla ricerca o citazioni autorevoli.
Fixer 1234

Chiesto e ha risposto, qui in SU anche se è molto più coinvolto di quanto il tuo D. Leggi la risposta accettata a questo Q . Tutti i dati / fonti / citazioni che potresti sperare! Puoi estrarre ciò che funziona per te dai suoi dati.
Gypsy Spellweaver,

Risposte:


5

Da un punto di vista professionale, le opzioni sono:

  1. Pregare.
  2. Fai più copie, su più dispositivi.

Nella tua "opzione 1" (molto più spazio) potresti aumentare marginalmente le tue probabilità realizzando più copie sullo stesso hardware, ma il fatto è che l'hardware non riesce, rendendo di rado illeggibile l'intero disco. Una singola copia non è una strategia di backup valida.

Non sono chiaro se si tratta di un backup effettivo (di file su un dispositivo principale) o di un archivio (di file rimossi dal dispositivo principale.) La copia aggiuntiva è un po 'più importante se ti preoccupi del caso dell'archivio - nel caso di backup c'è in teoria una copia primaria, quindi devi avere almeno due guasti prima di essere completamente sfortunato.


1
Mentre i tuoi consigli sono validi e apprezzati, non è quello che ho chiesto. Sembra che tu insinui che tutte le azioni che ho suggerito sono insignificanti / inutili in termini di longevità. È quello che stai dicendo?
einpoklum,

1
Scusate, ma la preghiera non è davvero da un punto di vista "professionale".
oldmud0

2
Se sei un buon ingegnere, pregherai Murphy e le tue offerte consisteranno in più case per questi dati, perché tutto ciò che può andare storto, andrà storto. Altre divinità e offerte potrebbero avere risultati meno soddisfacenti ...
Ecnerwal

1
Tbh, con una sola copia, cercare il favore divino non è la peggior idea.
Journeyman Geek

5

Se hai più spazio libero di quello che usano i dati di backup - la tua opzione 1 nella domanda - o se hai più copie dei dati, ho un'idea che "farebbe qualcosa"; se pensi che SpinRite sia davvero d'aiuto con la "manutenzione" del disco rigido e / o desideri sovrascrivere completamente e quindi riscrivere ogni bit dei tuoi dati, lo farebbe.

Sia che tu debba fare qualcosa o no, non sono troppo sicuro ... bit-rot o Degrado dei dati sembra esistere davvero, e domande come questa qui sul superutente e questa sul serverfault sembrano consigliare i backup o forse un errore- RAID corretto o tollerante agli errori (ma solo per un singolo disco rigido sceglierei più backup e controlli hash / CRC e non mi preoccuperei di cosa fare se un RAID si guasta).

Mi sto avvicinando all'approccio più semplice e pigro del "non fare nulla", ma quanto segue è almeno un buon "assicurati di poter ancora leggere i miei dati una volta all'anno, e potrei anche riscriverli" .

Emulazione Linux fai-da-te di alcune funzioni di manutenzione di SpinRite

Molte persone sembrano convinte che SpinRite funzioni davvero, ma non è gratuito e io eseguo Linux, quindi ho ascoltato COME funziona SpinRite di Steve Gibson ? video e dice che una delle cose che SpinRite fa ora è:

  • Legge l'intero disco
  • Capovolge i bit e li scrive
  • Li legge di nuovo
  • Capovolge i bit e li scrive
  • Li legge di nuovo

Se l'unità rileva problemi (minori), questo dovrebbe "indurre l'unità stessa a scambiare i settori danneggiati con quelli buoni".

Quanto spesso dovresti farlo? Steve dice "nessuno sa davvero quanto spesso sia, ma ogni pochi mesi dovrebbe essere abbastanza spesso" . Sto solo indovinando ogni 6 mesi o circa ogni anno.

badblocks

Il processo di lettura / capovolgimento / lettura / capovolgimento suona quasi identico a quello che badblocksfa quando usa il test in modalità di scrittura ( -wopzione) solo che non "capovolge" i dati, ma scrive, legge e capovolge in modo distruttivo tutti i bit sulla partizione:

Con questa opzione, i badblock scansionano i blocchi danneggiati scrivendo alcuni pattern (0xaa, 0x55, 0xff, 0x00) su ogni blocco del dispositivo, leggendo ogni blocco e confrontando il contenuto.

Non a caso, questi schemi sono, in binario: 10101010, 01010101, 11111111, 00000000.

Quindi badblocks scrive, legge e lancia bit abbastanza a fondo, ed è anche gratuito. Se hai mke2fseseguito i badblock (con badblocks -cc), salverà l'elenco dei badblock in modo che ext2 / 3/4 li eviterà, se ne sono stati trovati.

Il rovescio della medaglia è che i test di scrittura dei badblock sono distruttivi , quindi avrai bisogno di almeno due partizioni per farlo funzionare (per salvare e riscrivere i tuoi dati).

  • Conserva due copie dei tuoi dati sul disco rigido , ognuna su DIVERSE PARTIZIONI! .
    Ciò consente di sovrascrivere ogni bit su una singola partizione con 10, 01, 11, 00 raddoppia le possibilità di recupero se si sviluppano aree danneggiate. E conserva un elenco di checksum / hash per i tuoi file di dati, come CRC32 o MD5 (anche se gli MD5 / SHA sono molto lenti rispetto a CRC e CRC non dovrebbe perdere errori casuali)
  • Ogni pochi mesi:
    1. Leggi le tue copie di backup e verifica che corrisponda ancora ai checksum / hash.
    2. "Pseudo" -bit-capovolgi una partizione con badblocks -wo mke2fs -cc( Solo UNA partizione , non sovrascrivere tutti i tuoi dati, solo una copia!)
    3. Copia i tuoi dati sulla partizione appena capovolta
    4. "Pseudo" -bit-flip l'altra partizione (una che non è stata ancora capovolta)
    5. Copia i tuoi dati su quella partizione appena capovolta

Questo è simile alla sola riformattazione e copia dei dati, ma un formato rapido / standard di solito non scrive in tutti i settori, quindi potresti finire per non cambiare / capovolgere molti dei bit


La soluzione migliore è sempre più copie su più dispositivi .
Ho letto che i supporti ottici potrebbero essere leggibili per 10, 20, forse anche più di 50 anni, e due dischi identici / ISO si adatterebbero gddrescue(sotto).
L'archiviazione cloud è spesso gratuita per alcuni GB, archiviare i file lì (eventualmente crittografati) può essere una buona idea, soprattutto se gli importi continuano a salire.

Inoltre, il salvataggio dei file in un archivio con correzione degli errori può aiutare se si verificano errori, ma perdere un file su un milione potrebbe non essere così grave come perdere un intero archivio di un milione di file. Se esistesse un software separato per la correzione degli errori, come un ECC-CRC, questo potrebbe aiutare, ma non ne conosco nessuno, e una copia aggiuntiva dei dati sarebbe ancora migliore.


Correlato tangenzialmente, SpinRite "cerca molto duramente" di leggere i dati da un settore danneggiato di un disco rigido, leggendo da diverse direzioni e velocità, il che suona anche molto simile a gddrescue, nel caso (o quando) si verificano problemi nella lettura dei dati . gddrescue può anche leggere da due copie di dati con errori e si spera di mettere insieme una buona copia completa, e sono tentato di fare due (o più) copie identiche della tua partizione di dati dd, ma poi se i badblock trovano dei settori danneggiati non poteva evitarli poiché avrebbe cambiato le copie identiche.


Si può collegare a una spiegazione di esattamente come si po-Flig una partizione con badblockso mke2fs?
einpoklum,

Il bit-flip non risolverà l'indirizzo del settore che si trova al di fuori del settore. So che SpinRite usa abilmente alcune proprietà del controller del disco in un modo piuttosto sorprendente, non facilmente derivato dalle specifiche, che sta ancora mantenendo segreto. I ragazzi dietro HDD Regenerator potrebbero averlo capito, ma non è di pubblico dominio.
harrymc,

C'è qualche prova che lanciare fa qualcosa di buono? Sembra scambiare l'usura del disco per risolvere un problema di cui non ho mai visto alcun riferimento, mai e dovunque, in una fonte corretta e affidabile. Una citazione sarebbe molto educativa.
Journeyman Geek

@einpoklum Ho aggiornato la risposta in parte. Non ho un link diverso dalla pagina man per i badblock per sovrascrivere ogni bit, quindi riscrivere i tuoi dati.
Xen2050,

@JourneymanGeek Stavo solo seguendo ciò che dice Steve Gibson nel video collegato sul suo sito, essenzialmente "dalla bocca del cavallo". Ma sfortunatamente non ho e non sono riuscito a trovare altri riferimenti, almeno da una rapida ricerca. In realtà ricevo l'impressione dalle altre domande SE che il bit-rot potrebbe non essere molto preoccupante, e solo riscrivere da solo, anche gli stessi bit nello stesso posto, può causare i "domini magnetici nella superficie del disco fisico [ a] essere rinnovato con la sua forza originale "
Xen2050

5

Dal momento che sembra che la maggior parte dei manifesti abbia perso qui, questa è la mia risposta raccomandata ai dettagli della tua domanda, usando questo eccellente post, Quale mezzo dovrebbe essere usato per l'archiviazione dei dati (a lungo termine, ad alto volume, a lungo volume)? come guida. Non citerò le referenze e le ricerche da lì, poiché ha fatto un ottimo lavoro e leggere l'intero post è meglio del sommario per questo caso.

Limitare se stessi a un HDD in una cella frigorifera (offline), con le due opzioni fornite è necessario collegare l'unità ogni due anni o più tardi e avviarla. La ragione principale per farlo è impedire al grasso del mandrino di indurirsi e gripparsi. Il grasso del mandrino si indurirà nel tempo e la rotazione del disco di tanto in tanto può ritardare significativamente tale eventualità. Se vuoi avere un'idea dell'importanza del grasso per un HDD, guarda la quantità di sforzo che Minebea ha fatto, in questo rapporto un produttore di motori per HDD si occupa delle sue ricerche al riguardo .

Mentre il disco è collegato, è possibile eseguire anche alcuni programmi diagnostici SMART per cercare segni di guasto imminente dell'elettronica, dell'hardware o del piatto. Sebbene, dalla ricerca presentata a FAST'07 da Google e dalla Carnegie Mellon University {vincendo il "miglior documento" quell'anno}, il test SMART può essere indicativo di fallimento, ma un test di "superamento" potrebbe non essere indicativo di buona salute. Tuttavia, il controllo non farà male. Sì, è una vecchia ricerca, ma nessuno sembra averlo sostituito con qualcosa di più nuovo.

Avere l'unità in funzione per un po 'e accedere ai dati rinnoverà anche la forza dei campi magnetici che contengono i dati. Alcuni sostengono che non è necessario basarsi su orde di prove aneddotiche, ma quale ricerca sembra indicare che l'indebolimento dei campi magnetici è possibile. Vi presento tre articoli dell'Università del Wisconsin-Madison: Parity Pollution , Data Corruption e Disk-Pointer Corruption . Dopo aver letto questi puoi decidere in che misura le loro conclusioni minacciano i tuoi dati e quanto sforzo vale la pena proteggerli.

Routine di cura consigliata

Non so quale sistema operativo usi, quali strumenti hai o preferisci, né quale file system scegli. Pertanto i miei suggerimenti saranno solo generici, consentendoti di scegliere gli strumenti che meglio si adattano alla tua configurazione e preferenze.

Il primo è l'installazione per l'archiviazione. Prima di salvare i file sull'HDD, crearne degli archivi. Ciò non implica la compressione, né la evita. Scegli un formato di archivio che ti darà capacità di recupero degli errori o di "auto-guarigione". Non creare un archivio enorme, ma piuttosto archiviare le cose che si uniscono, creando una libreria di archivi. Se scegli la compressione, assicurati che non interferisca con la capacità di recupero degli errori. Per la maggior parte dei formati di musica, video, film e immagini non ha senso eseguire la compressione. Tali formati di file sono già compressi e il tentativo di comprimerli raramente guadagna spazio, talvolta creando dimensioni maggiorifile e fa perdere tempo e potenza della CPU nell'affare. Tuttavia, archiviali per il recupero degli errori sopra riportato. Quindi crea un check-sum per ogni file di archivio, usando l'algoritmo digest di tua scelta. La sicurezza non è il problema qui, semplicemente un controllo di integrità per il file, quindi MD5 dovrebbe essere sufficiente, ma tutto funzionerà. Salvare una copia delle somme di controllo con i file di archivio ein secondo luogo sullo stesso HDD, forse una directory dedicata per la raccolta totale di somme di controllo. Tutto questo viene salvato sul disco. Successivamente, e abbastanza importante, è anche quello di salvare su quell'HDD gli strumenti che hai usato per creare le somme di controllo e ripristinare gli archivi (e anche per decomprimere, se hai usato la compressione). A seconda del sistema in uso, potrebbero trattarsi dei programmi stessi o potrebbe essere necessario installarli. Ora puoi archiviare l'HDD come preferisci.

Il secondo è l'archiviazione. Gli attuali HDD sono ragionevolmente protetti da shock fisici (scosse tremanti e rimbalzanti), ma non ha senso spingerli neanche. Conservalo praticamente come hai menzionato nella tua domanda. Vorrei aggiungere per cercare di evitare aree in cui è probabile che siano soggette a forze elettromagnetiche. Ad esempio, non nella stessa chiusura del pannello dell'interruttore o sopra la radio HAM. I fulmini a miglia di distanza sono qualcosa che non puoi evitare, ma l'aspirapolvere e la potenza dicono che sono evitabili. Se vuoi diventare estremo, prendi uno scudo di Faraday o una borsa di Faraday per questo. Di voi due suggerimenti sono o inutili o cattivi. Cambiare la sua posizione fisica mentre è memorizzato non influirà su tutto ciò che conta e scuoterlo potrebbecausare danni, non dovrebbe come la maggior parte delle unità hanno una buona protezione G-shock, ma è possibile.

L'ultimo è le misure periodiche. In base a una pianificazione scelta, ogni anno o ogni due anni, ad esempio, rimuoverlo dall'archivio e ricollegarlo al computer. Esegui il test SMART e leggi i risultati. Preparati a sostituire il disco quando i risultati SMART mostrano che dovresti, non "la prossima volta", ma "questa volta". Mentre è collegato, controlla tutti i file di archivio con le loro somme di controllo. In caso di esito negativo del controllo, provare a utilizzare le capacità di recupero degli errori del formato di archivio per ripristinare quel file, ricreare l'archivio, il relativo checksum e salvarlo nuovamente. Dato che hai anche fornito l'opzione 2 con una "buona quantità" di spazio libero, copia gli archivi in ​​nuove directory e quindi elimina gli originali. Semplicemente "spostandoli" potrebbe non spostarli affatto. Su molti file system più recenti lo spostamento del file cambierà la directory in cui è elencato, ma i contenuti del file rimarranno dove sono. Copiando il file lo costringi a essere scritto altrove, quindi puoi liberare spazio eliminando l'originale. Se si dispone di molti file di archivio, è probabile che nessuno sia così grande da riempire lo spazio libero sull'HDD. Dopo aver verificato o ripristinato tutti i file e aver spostato quelli che preferisci, ripristina la confezione e rimettila in archivio fino alla prossima volta.

Cose extra a cui prestare attenzione. Quando aggiorni il tuo sistema o, peggio ancora, passi a un altro sistema operativo, assicurati di avere ancora la possibilità di leggere quell'HDD nella nuova configurazione. Se hai qualcosa che non è un semplice testo, assicurati di non perdere la possibilità di leggere il file come salvato. Ad esempio: i documenti MS-Word possono avere equazioni create in un formato, le versioni più recenti non possono leggerle. Vedi questo per quello stesso problema. Word non è l'unica possibile fonte di problemi, tuttavia, e nemmeno i formati Open Source garantiscono che i tuoi dati siano a prova di futuro. Per un grosso errore in questo regno leggi il progetto Digital Domesday Book fallito. Man mano che vengono visualizzate le nuove tecnologie, considera di aggiornare anche la tua collezione. Se hai film salvati come file AVI e ti piace meglio MKV, convertili. Se si dispone di documenti di elaborazione testi e si aggiorna il programma, salvare nuovamente quelli archiviati nel nuovo formato.


4

I supporti magnetici possono sbiadire nel tempo e il risultato è un brutto settore o settore. Una soluzione potrebbe essere quella di rinnovare la parte magnetica una volta ogni pochi anni.

Il modo più semplice è quello di copiare e riscrivere l'intero disco rigido, anche se ciò potrebbe non rinnovare l'indirizzo del settore, che è l '"intestazione" del settore che consente al firmware di posizionare la testa su di esso. Il rinnovo dell'indirizzo di settore può richiedere la riformattazione del disco (formattazione profonda - non rapida).

Una soluzione alternativa consiste nell'utilizzare i prodotti di rigenerazione del disco. Questi prodotti scansionano il disco a livello fisico, leggendo ogni settore e il suo indirizzo e riscrivendo entrambi per rinnovare i dati magnetici.

Il vantaggio aggiuntivo è che in caso di errore di lettura, questi prodotti proveranno più metodi di lettura al fine di salvare i dati, contrassegneranno il settore come danneggiato e lo rimasterizzeranno in un settore di riserva (la maggior parte dei dischi rigidi ha settori di riserva), quindi il i dati vengono salvati.

Ecco alcuni di questi prodotti:

  • DiskFresh (gratuito per uso privato e non commerciale o $ 25) - Parte delle Utilità Puran che ottengono buone recensioni. Ti informa solo se ci sono settori danneggiati / danneggiati e non esegue il ripristino avanzato.

  • SpinRite ($ 89 con garanzia di rimborso) - Questo non è stato aggiornato per alcuni anni, anche se ha salvato il mio disco alcuni anni fa. Non mi fiderei della garanzia di rimborso in quanto il prodotto è piuttosto vecchio.

  • Rigeneratore HDD ($ 89,99 con garanzia di rimborso) - Un nuovo prodotto con buone recensioni.

Per completezza, per i lettori alla ricerca di archiviazione sicura a lungo termine, vorrei sottolineare che esistono prodotti DVD e Blu-Ray "write-once read-forever", commercializzati come M-DISC o Archival Disc.


So che SpinRite utilizza il proprio supporto di avvio; che dire degli altri che hai citato? Sono basati su Windows? Basato su Linux? Proprio avviabile-based?
einpoklum,

1
DiskFresh funziona in Windows e HDD Regenerator esegue sia Windows sia il disco flash di avvio.
harrymc,

Quindi forse dovrei chiederti se fare l'equivalente di quello su Linux richiede un avviabile separato, o se puoi semplicemente accontentarti di /dev/sdXfile di dispositivo ddo qualcosa di simile.
einpoklum,

1
@einpoklum: Qualsiasi prodotto (i) sotto qualsiasi sistema operativo che esegue formattazione profonda e imaging del disco e riscrive farà il lavoro, incluso dd per la parte di riscrittura. Il punto è rinnovare completamente tutti i settori del disco, settori utilizzati sia per i dati dei file che per i metadati. Durante la copia del disco è necessaria una memoria temporanea alternativa, ma oggi è economica.
Harry

@einpoklum: è possibile utilizzare DiskFresh per la manutenzione e utilizzare solo le utility più avanzate per recuperare dagli errori (successo non garantito). DiskFresh dovrebbe essere sufficiente in condizioni di conservazione corrette.
harrymc,

3

Non è necessario eseguire alcuna manutenzione . Ricollegare l'unità e accenderla rappresenta un rischio maggiore rispetto al fatto che funzioni continuamente e molto più che lasciarlo dormire in una scatola. Quindi controllarlo molto spesso aumenterebbe effettivamente la probabilità di danno.

Il modo in cui lo conservi è eccellente, ma non dimenticare la temperatura . Non lasciare che sia estremo. Cosa usi esattamente come unità di backup? Alcuni sono molto più resistenti di altri.

Una cosa che puoi fare, dato che hai abbastanza spazio come hai affermato, fare due copie degli stessi dati sull'HDD . In caso di settori danneggiati, starai bene. Da quello che ho notato, la maggior parte delle unità oggi subisce danni al settore all'inizio dell'unità (primi GB), ma ciò è dovuto principalmente al sistema operativo (non al tuo caso). Generalmente, i settori danneggiati appariranno inizialmente nella maggior parte dei casi raggruppati insieme, quindi avere due copie dei dati sulla stessa unità aiuta.

Se hai solo pochi file critici, sarebbe una buona pratica salvarli anche altrove, solo per sicurezza. Crea un archivio crittografato e mettilo su un bastone o regalalo a qualcuno di cui ti fidi.


1
La parte 'note' elenca quale HDD specifico viene utilizzato (Toshiba STOR.E nozioni di base da 750 GB). Inoltre, è possibile collegarsi a qualche tipo di riferimento per l'affermazione che l'accensione e il collegamento delle unità riduce il tempo stimato in caso di guasto? Non che non ci sia motivo per l'affermazione, è solo che altre persone suggeriscono essenzialmente il contrario.
einpoklum,

C'è qualcosa che puoi citare come base per l'affermazione che nessuna manutenzione dovrebbe essere eseguita e che accenderla è un rischio più elevato?
Fixer 1234

Non sono d'accordo con l'argomento per nessuna manutenzione, dal momento che anche un disco che rimane non alimentato potrebbe ancora andare male, ed essendo non alimentato non lo rileverai mai.
harrymc,

Statisticamente, è molto più probabile che venga danneggiato quando lo si accende per un controllo rispetto al non accedervi affatto.
Overmind

Non ho visto tali statistiche e, anche se esistono, certamente non si applicano quando sono accese una volta per diverse ore una volta ogni pochi anni . Ci vorrebbero migliaia di accensioni per causare danni misurabili a un disco.
harrymc,

3

Ho sempre pensato che il trucco fosse supporre che il tuo disco non funzionasse . Ci sono alcune modalità di fallimento che sono casuali. Per guasti non casuali - ci sono due aspetti qui - l'unità e il filesystem.

Sebbene sia un po 'una fonte insolita - questo thread reddit suggerisce che un dato bit potrebbe capovolgersi in circa 10 anni, anche se sospetto che un singolo bit capovolto sarebbe gestito silenziosamente da ECC - nel filesystem o sull'unità stessa.

In genere è possibile trovare problemi "su larga scala" relativi all'età con test SMART periodici, esaminando elementi come i settori in riallocazione in sospeso. Con i cicli di lavoro relativamente brevi, non dovresti vedere molto, ma qui siamo un po 'paranoici. Ancora una volta, fino a quando le cose non vanno davvero male, il tuo disco probabilmente lo gestirà silenziosamente in ECC.

Infine, c'è il rischio di morte improvvisa dell'unità o del controller . In teoria, puoi azionare l'unità, eseguendola a temperature controllate e fredde, che sono note per massimizzare la durata dell'unità, ma non sono mai stata davvero accarezzata dalle unità.

Si suppone che le unità abbiano un certo numero di spin-up e spin-down (un problema non qui) e sospetto che espellere correttamente l'unità consentirebbe di scaricare i dati nell'unità e ci sono strumenti per spegnere le unità. Credo che hdparm lo farebbe, ma ho bisogno di ulteriori test.

Infine, scelgo unità che sono note per durare . Ruoto anche unità esterne ogni pochi anni, spostando unità più vecchie nella gerarchia.

In teoria i file system come ReFS e zfs sono progettati per ridurre il rischio di perdita di dati tramite checksum di dati integrati. Per lo meno, non avrai file danneggiati in modo silenzioso. Selezionarli su file system più comuni, probabilmente ridurrebbe la possibilità di perdita di dati, ma non esiste ancora un modo "semplice" per distribuirli su un sistema operativo desktop. ZFS ha un supporto abbastanza decente su Linux e nessuno su Windows, e ReFS non è ancora arrivato al desktop di Windows. Questi sono progettati per avere più copie su una o più unità per il recupero effettivo, quindi non funzionerebbe esattamente qui.


2
Tecnicamente, i checksum su ZFS (e forse ReFS) non fanno nulla per ridurre da soli la perdita dei dati, ma solo per verificare l'integrità dei dati. Avrai comunque bisogno di un'unità di parità o mirror (ovvero una sorta di ridondanza) per recuperare da eventuali errori / corruzione. Non credo che ci siano filesystem (popolari) che possono recuperare da soli con una singola unità (e se ne esistono, dovranno sacrificare lo spazio su disco per farlo).
Bob,

Aggiornato per riflettere ciò. Non si è preoccupato di andare molto oltre perché questi filesystem non funzionavano davvero nel suo caso d'uso /
Journeyman Geek

Sì, l'unico vantaggio dei checksum in questo tipo di scenario è che almeno sai quali file / unità non ti fidi.
Bob

Perché i settori dovrebbero essere riallocati quando l'HDD è semplicemente seduto lì? Voglio dire, potresti suggerire di controllare le statistiche SMART dopo aver copiato l'intero contenuto del disco in un posto temporaneo (o /dev/nullforse?), E questo causerebbe errori e riallocazioni.
einpoklum,

Questa è una buona domanda: ciò non dovrebbe accadere affatto in circostanze normali, specialmente con cicli di lavoro abbastanza minimi. Per quanto breve, improvvisa e inaspettata, e la morte molto terminale del tuo disco rigido, è improbabile che accada qualcosa sul disco. La maggior parte delle modalità di errore che riesco a pensare tendono ad essere inaspettate.
Journeyman Geek

2

Come vediamo dalle raccomandazioni di altri, una singola risorsa di backup non è una soluzione affidabile SE il backup ha valore. L'esperienza con i dispositivi elettronici ha insegnato a molti di noi (nel modo più duro) che non è una questione di IF ma di QUANDO un dispositivo di backup fallirà.

I dischi rigidi, in base alla progettazione, sono per l'archiviazione dei dati relativamente a breve termine. Due articoli eccellenti, /server/51851/does-an-unplugged-hard-drive-used-for-data-archival-deteriorate e Quanto tempo prima che un disco rigido non utilizzato perda i suoi dati? discutere la durata dei dati memorizzati su un disco rigido. Come sempre, il tuo chilometraggio può variare.

La soluzione di backup che descrivi è migliore di nessun backup, ma hai ancora un singolo punto di errore. Con il tuo backup su un singolo dispositivo, rischi di perdere l'UNICA copia dei tuoi dati in caso di incendio, inondazione, furto, esplosione, guasto del dispositivo, ecc. Quindi la domanda è: i tuoi sforzi per preservare il tuo backup sono una degna spesa del tuo tempo?

Per raggiungere il tuo obiettivo, ovvero un backup su cui puoi fare affidamento, è necessario più di un backup. Se hai intenzione di archiviare i tuoi dati su un disco rigido, il backup richiede occasionalmente un "aggiornamento" per contrastare il degrado dei dati di archiviazione a lungo termine inerente alle unità del disco rigido. Se indossassi le tue scarpe, acquisterei una seconda unità di backup simile all'originale e una volta all'anno copierei i dati dall'unità primaria all'unità secondaria. Alla fine di ogni anno, invertire il processo e copiare i dati dall'unità secondaria all'unità primaria. Risciacquare e ripetere ogni anno. Una delle unità dovrebbe rimanere fuori sede, lontana dalla propria posizione per evitare di perdere l'unica copia di dati a causa di un disastro naturale.


Mentre tutto ciò che dici è vero, solo l'ultimo paragrafo risponde alla domanda.
einpoklum,

C'è qualcosa che puoi citare come base per il beneficio dell'aggiornamento e il periodo di un anno?
Fixer 1234

1

Non sono riuscito a trovare dati credibili e scientificamente sostenuti al riguardo. In generale, ci sono due aspetti di questo problema:

  1. Bit rot : vari effetti fisici possono capovolgere i bit memorizzati nei domini magnetici memorizzati sui piatti dell'HDD, danneggiando così i dati sull'HDD. (il disco è ancora perfettamente funzionante)
  2. Problemi meccanici : accendere / spegnere l'unità, mantenere i piatti rotanti o fermi, condizioni di conservazione e invecchiamento naturale possono rendere inutilizzabile l'unità dopo un po 'di tempo. (i dati potrebbero essere ancora intatti e recuperabili)

Il bit rot è discusso in questo thread dal 2008. L'utente arnaudk ha scritto:

Da quello che posso accertare, sembra che occorrerebbero circa 22 anni (dettagli di seguito) per perdere i dati a causa della smagnetizzazione guidata termicamente se il disco rigido fosse semplicemente immobile a temperatura ambiente in un angolo buio. In realtà, questa volta sarà un po 'più breve a causa delle vibrazioni meccaniche e dei campi magnetici esterni derivanti da tutto, dal motore del disco rigido stesso alle tempeste di fulmini a 50 km di distanza.

I livelli accettabili di decadimento del segnale variano in base alla progettazione del sistema, ma in genere vanno dal 10-20% [ref4], quindi occorrerebbe (-1/326000) * ln (0,8) = circa 22 anni affinché un intero dominio di bit ottenga il 20% più debole causando una possibile perdita di dati dovuta esclusivamente agli effetti di smagnetizzazione termica.

(link diretto alla posta)

Questa è l'unica stima che ho potuto trovare. Se è corretto, è possibile riscrivere in sicurezza l'intera unità ogni 5 anni per "aggiornare" i dati.

I problemi meccanici sono ancora più un mistero. Backblaze è una società che utilizza migliaia di dischi rigidi di livello consumer nel proprio data center e pubblica regolarmente aggiornamenti sul proprio benessere. Secondo le loro stime dopo 4 anni di rotazione 24/7, il 20% dei dischi rigidi è morto e se la tendenza continua, dopo 6 anni la metà di essi sparirà. Questo è più o meno in linea con le cifre di questo white paper di Google . Tuttavia, questo non è un caso d'uso standard per un disco rigido e difficilmente possiamo confrontarlo con un'unità non in linea in una scatola. Non sono a conoscenza di studi che abbiano affrontato questo caso.

Tutto sommato, se ti interessano davvero quei dati, dovresti conservarne due copie e trasferirli su un nuovo HDD sottoposto a stress ogni 5 anni circa. Ciò dovrebbe mantenere i domini magnetici e l'hardware ragionevolmente freschi, ma YMMV.


0

Aumentare la durata di un disco rigido è una delle questioni in cui si ottiene il miglior risultato facendo il minimo. Scartalo, posizionalo su una piattaforma solida lontano da calore, umidità, polvere o radiazioni intensi, dove vi sia sufficiente circolazione d'aria e la minima probabilità che un bambino lo rompa per sbaglio. Puoi aspettarti una lunga durata dal tuo disco rigido fino a quando arriva il momento di aggiornarlo.

Forse è difficile accettare che come consumatore, c'è molto poco (anche niente) che puoi fare per aumentare la longevità del disco rigido. Ma ci sono certamente modi per migliorare le possibilità di sopravvivenza dei tuoi dati: ReFS, RAID e backup.

Credetemi, l'industria sta lavorando per migliorare la longevità dei dati stessi rispetto ai dischi rigidi.


Proteggerlo dai danni è un buon consiglio. C'è qualcosa che puoi citare per sostenere l'affermazione che c'è poco che aumenterà la longevità?
Fixer 1234

-1

Nella mia esperienza il passaggio frequente da start / stop (inattivo / in esecuzione) è negativo per gli HDD, è meglio tenerli sempre in rotazione se si ok che assorbirà più elettricità. (Testato su più sistemi con gli stessi HDD dello stesso negozio, in cui alcuni HDD sono costretti a girare sempre e altri no)

Su tutti i server in esecuzione su base regolare uno al giorno "breve" test SMART e durante il fine settimana "test lungo" che almeno può dare un'idea quando l'HDD fallirà. Se si utilizza ZFS, è sufficiente eseguire regolarmente lo "scrubbing" una volta al mese per le versioni enterprise dell'HDD e una volta alla settimana per l'HDD consumer.

Un buon alimentatore decente è anche uno dei fattori per un HDD sano, oltre a UPS che impediscono sorprese casuali di elettricità bypassando l'HDD. (Gli HDD esterni ricevono energia dal computer, quindi si applica anche a loro)

Le vibrazioni / le vibrazioni mentre l'HDD è in esecuzione non fanno bene anche a loro. (Particolarmente importante per l'HDD portatile - non spostarli mentre funziona)

Inoltre, scegliere il modello giusto per determinati lavori dell'HDD (sorveglianza, NAS, desktop ...) è un modo per prolungare il loro live


1
Non credo che lo esegua nella scatola ...
Journeyman Geek

In realtà non lo eseguo ... è solo un backup. Ovviamente non lo eseguirò dall'interno della scatola :-) Per questo motivo il consiglio su un UPS o vibrazioni ecc. È irrilevante per il mio caso (sarebbe rilevante per un disco che è in uso costante / frequente
einpoklum

Non direi che UPS è irrilevante. Anche se si tratta di un'unità di backup esterna, deve comunque essere alimentata e, nel caso in cui qualcosa sia accaduto sulle linee elettriche, qualcosa dovrebbe proteggere tali situazioni.
Alex

Coloro che hanno il voto negativo, si prega di lasciare un motivo nei commenti. È un argomento interessante, quindi vorrei sapere cosa c'è che non va. La tua opinione andrà a beneficio di tutti.
Alex

-3

In generale, se si tratta di un sistema Linux di quanto non sia mai necessaria alcuna manutenzione. I sistemi Windows sembrano perdere cluster molto più spesso di Linux. Per questo motivo, un chkdsk ogni 3-6mo è saggio sul sistema Windows.

Tutte le parti del disco rigido con boccole e cuscinetti alla fine presentano un disallineamento dovuto all'usura dopo 5 o più anni di uso costante. Il modo migliore che ho scoperto di non svegliarmi un giorno con una partizione danneggiata è di riformattare almeno ogni 5 anni.

Generalmente ho qualcosa che richiede una profonda revisione del mio sistema ogni due anni e quindi riformatta in quel momento (assicurati di usare un riformattazione completa con controllo degli errori). La mia memoria è abbastanza buona da notare un calo dello spazio sul disco rigido dopo la formattazione; questa è un'indicazione che l'unità non funziona. Se una persona non ha familiarità con il proprio sistema, potrebbe conservare i record del conteggio esatto dei byte dopo la formattazione.

Ad un certo punto verranno utilizzati i settori "extra" (appositamente per questo scopo) e il sistema inizierà a contrassegnare le aree "normali" sull'unità come inutilizzabili - il conteggio dei byte diminuirà. A questo punto il disco dovrebbe essere raschiato - probabilmente ci sarà già una perdita di dati. Questo è normale per un disco rigido che viene mantenuto 24/7 in 5-10 anni.

L'unico modo per prolungare la longevità dell'unità è impostare il sistema per spegnerlo dopo alcuni minuti di inattività. Ho un'unità da 2 TB che utilizzo come backup principale e ho impostato lo spegnimento dopo 10 minuti di inattività. Potrei passare 30 giorni senza accedervi e quindi rimane spento. Ci vogliono 20 secondi per accendersi e diventare leggibili se necessario.


Quindi, se la discussione è limitata alla shelf life, non viene mai accesa periodicamente; poi ci sono le preoccupazioni ambientali ben coperte coperte nel link sopra "Quanto tempo prima che un disco rigido inutilizzato perda i suoi dati?" L'unico problema che non ho visto menzionato in quella discussione sull'elettronica non alimentata è la shelf life dei condensatori. Durano più a lungo con l'uso periodico; altrimenti si seccano; questa è la struttura elettrochimica di un condensatore (e batterie).

La regola empirica per la durata del condensatore è di 20 anni. Questa è chiamata la regola 20/20. Il guasto del condensatore sarà massimo nei primi 20 minuti di utilizzo, quindi il guasto statistico verrà nuovamente superato dopo 20 anni di utilizzo. Ma falliscono molto prima di 20 anni se non utilizzati.

L'errore più comune (in generale) nei componenti elettronici sono i condensatori. Condensatori (elettrochimici), quindi induttori e trasformatori (elettro-meccanici) si consumano indipendentemente dal fatto che vengano utilizzati o meno.


Una società chiamata Backblaze ha raccolto dati su guasti del disco rigido. Ha rilasciato tali dati nei blog aziendali, evidenziando quali unità del produttore hanno fallito più spesso di altre.

In un recente blog ha pubblicato dati che indicano esattamente quali 5 attributi SMART indicano un guasto imminente dell'unità:

From experience, the following 5 SMART metrics indicate impending disk drive failure:

    SMART 5 – Reallocated_Sector_Count.
    SMART 187 – Reported_Uncorrectable_Errors.
    SMART 188 – Command_Timeout.
    SMART 197 – Current_Pending_Sector_Count.
    SMART 198 – Offline_Uncorrectable.

Puoi scegliere un sottoinsieme come questi 5 suggerimenti suggeriti perché sono coerenti tra i produttori e sono buoni predittori di fallimento.

L'articolo continua a suggerire:

SMART 5: Reallocated_Sector_Count 1-4 tienilo d'occhio, più di 4 sostituisci

SMART 187: Reported_Uncorrect 1 o più sostituisci

SMART 188: Command_Timeout 1-13 tienilo d'occhio, più di 13 sostituiscono

SMART 197: Current_Pending_Sector_Count 1 o più sostituisci

SMART 198: Offline_Uncorrectable 1 o più sostituisci


4
> I sistemi Windows sembrano perdere cluster molto più spesso di Linux. Per questo motivo, un chkdsk ogni 3-6mo è saggio sul sistema Windows. [citazione necessaria] - Non ho mai sentito questo consiglio prima. Non dal 2007, comunque. Ed è piuttosto ortogonale alla domanda, che per lo più pone domande sull'hardware nello storage spento: hardware a cui non importa davvero quale tipo di filesystem stai usando.
Bob,

1
Inoltre, l'utilizzo di qualsiasi tipo di conteggio del "settore danneggiato" a livello di filesystem per verificare l'integrità dell'unità è ... strano. Questo è ciò per cui esiste SMART. Che riporta anche incidentalmente sia il conteggio del settore riallocato che il conteggio del settore [riallocazione] in sospeso (e se uno di questi è tutt'altro che 0, è il momento di sostituire l'unità).
Bob,

1
Questa risposta, sebbene possa contenere informazioni utili (se qualcuna è più che congettura) non risponde ai chiari requisiti indicati nella domanda, che riguardava in particolare la cura e la manutenzione adeguate per la massima probabile longevità dell'hardware di spegnimento.
music2myear il

1
@jwzumwalt Non vedo la (non) esistenza di uno strumento integrato come particolarmente importante: i dati sono lì, l'hardware e il firmware lo supportano ed è accessibile da software, ad esempio CrystalDiskInfo. (E se stai cercando di confrontare i sistemi operativi, non c'è nessuno strumento integrato / preinstallato su molti dstros Linux, incluso Debian.) SMART è molto il modo standard del settore di rilevare guasti imminenti del disco (sebbene, per essere onesti , in un ambiente aziendale più grande hanno la stessa probabilità di lasciarlo fallire e sostituirlo dopo il fatto, ridondanza yay).
Bob

1
Quale "sistema Linux" o "sistema Windows"? Cosa indossare? Penso che tu stia parlando di dischi che sono in uso su un sistema in esecuzione, piuttosto che rispondere alla mia domanda.
einpoklum,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.