Risposta breve
È impossibile garantire un lungo periodo a causa dell'entropia (chiamata anche morte!). I dati digitali decadono e muoiono, proprio come qualsiasi altra cosa nell'universo. Ma può essere rallentato.
Al momento non esiste un modo a prova di errore e scientificamente provato per garantire oltre 30 anni di freddo archivio di dati. Alcuni progetti mirano a farlo, come il progetto Rosetta Disks del museo Long Now , sebbene siano ancora molto costosi e con una bassa densità di dati (circa 50 MB).
Nel frattempo, è possibile utilizzare supporti ottici resilienti scientificamente provati per la conservazione a freddo come Blu-ray Disc di tipo HTL come Panasonic, o DVD + R di qualità archivistica come Verbatim Gold Archival, e conservarli in scatole a tenuta d'aria in un punto debole (evitare alta temperatura) e fuori dalla luce.
Siate inoltre RIDONDANTI : fate più copie dei vostri dati (almeno 4) e calcolate gli hash per verificare regolarmente che tutto vada bene e ogni pochi anni dovreste riscrivere i vostri dati su nuovi dischi. Inoltre, usa molti codici di correzione degli errori , ti permetteranno di riparare i tuoi dati corrotti!
Risposta lunga
Perché i dati sono danneggiati nel tempo? La risposta sta in una parola: entropia . Questa è una delle forze primarie e inevitabili dell'universo, che rende i sistemi sempre meno ordinati nel tempo. La corruzione dei dati è esattamente questo: un disordine nell'ordine dei bit. Quindi, in altre parole, l'Universo odia i tuoi dati .
Combattere l'entropia è esattamente come combattere la morte: probabilmente non ci riuscirai mai. Ma puoi trovare il modo di rallentare la morte, proprio come puoi rallentare l'entropia. Puoi anche ingannare l'entropia riparando le corruzioni (in altre parole: non puoi fermare le corruzioni, ma puoi ripararle dopo che si sono verificate se hai preso le misure in anticipo!). Proprio come qualsiasi cosa sulla vita e sulla morte, non esiste un proiettile magico, né una soluzione per tutti, e le migliori soluzioni richiedono di impegnarsi direttamente nella cura digitale dei dati. E anche se fai tutto correttamente, non sei sicuro di proteggere i tuoi dati, massimizzi solo le tue possibilità.
Ora per le buone notizie: ora ci sono modi abbastanza efficienti per conservare i tuoi dati, se combini supporti di archiviazione di buona qualità e buone strategie di archiviazione / cura : dovresti progettare per il fallimento .
Quali sono le buone strategie di cura? Andiamo subito a una cosa: la maggior parte delle informazioni che troverai riguarderanno i backup, non l'archiviazione. Il problema è che la maggior parte delle persone trasferirà le proprie conoscenze sulle strategie di backup in archivio, e quindi molti miti sono ora comunemente ascoltati. In effetti, l'archiviazione dei dati per alcuni anni (backup) e l'archiviazione dei dati per il tempo più lungo possibile in almeno decenni (archivio) sono obiettivi totalmente diversi e richiedono quindi strumenti e strategie diversi.
Fortunatamente, ci sono un sacco di ricerche e risultati scientifici, quindi consiglio di fare riferimento a quegli articoli scientifici piuttosto che su forum o riviste. Qui, riassumerò alcune delle mie letture.
Inoltre, diffidare di affermazioni e studi scientifici non indipendenti , sostenendo che tale o tale supporto di memorizzazione è perfetto. Ricorda il famoso progetto BBC Domesday: «Digital Domesday Book dura 15 anni e non 1000» . Ricontrolla sempre gli studi con documenti veramente indipendenti e, se non ce ne sono, supponi sempre che il supporto di archiviazione non sia buono per l'archiviazione.
Chiariamo cosa stai cercando (dalla tua domanda):
Archivio a lungo termine : vuoi conservare copie dei tuoi dati "personali" sensibili e irriproducibili. L'archiviazione è fondamentalmente diversa da un backup , come ben spiegato qui : i backup sono per dati tecnici dinamici che vengono regolarmente aggiornati e quindi devono essere aggiornati in backup (ad es. Sistema operativo, layout delle cartelle di lavoro, ecc.), Mentre gli archivi sono dati statici che si sarebbe probabilmente scrivere solo una volta e solo letto da tanto in tanto . Gli archivi sono per dati temporanei , generalmente personali.
Celle frigorifere : si desidera evitare il più possibile la manutenzione dei dati archiviati. Questo è un GRANDE vincolo, in quanto significa che il supporto deve utilizzare componenti e una metodologia di scrittura che rimanga stabile per molto tempo, senza alcuna manipolazione da parte dell'utente e senza richiedere alcuna connessione a un computer o all'alimentazione elettrica.
Per facilitare la nostra analisi, studiamo prima le soluzioni di conservazione a freddo, quindi le strategie di archiviazione a lungo termine.
Mezzi di conservazione frigoriferi
Abbiamo definito sopra quale dovrebbe essere un buon supporto di memorizzazione a freddo: dovrebbe conservare i dati per lungo tempo senza alcuna manipolazione richiesta (ecco perché si chiama "freddo": puoi semplicemente memorizzarli in un armadio e non è necessario collegarli a un computer per conservare i dati).
La carta può sembrare il supporto di memorizzazione più resistente sulla terra, perché spesso troviamo manoscritti molto antichi di epoche antiche. Tuttavia, la carta presenta grossi inconvenienti: in primo luogo, la densità dei dati è molto bassa (non può contenere più di ~ 100 KB su una carta, anche con caratteri minuscoli e strumenti informatici) e si degrada nel tempo senza alcun modo di monitorarla: la carta , proprio come i dischi rigidi, soffrono di corruzione silenziosa. Ma mentre è possibile monitorare corruzioni silenziose sui dati digitali, non è possibile sulla carta. Ad esempio, non puoi garantire che un'immagine conserverà gli stessi colori solo per un decennio: i colori si degraderanno e non avrai modo di trovare quali fossero i colori originali. Certo, puoi curare le tue foto se sei un professionista nel ripristino delle immagini, ma ciò richiede molto tempo, mentre con i dati digitali, puoi automatizzare questo processo di cura e restauro.
Hard Disk (HDD) sono noti per avere una vita media di 3 a 8 anni: non si limitano a degradano nel tempo, essi sono garantiti per poi morire (cioè: inaccessibile). Le seguenti curve mostrano questa tendenza per tutti gli HDD a morire a un ritmo sbalorditivo:
Curva della vasca che mostra l'evoluzione del tasso di guasto dell'HDD dato il tipo di errore (applicabile anche a qualsiasi dispositivo progettato):
Curva che mostra il tasso di guasto dell'HDD, tutti i tipi di errore uniti:
Fonte: Backblaze
Puoi vedere che ci sono 3 tipi di HDD relativamente al loro fallimento: quelli che muoiono rapidamente (ad esempio: errore di produzione, HDD di cattiva qualità, guasti alla testa, ecc.), Quelli a tasso di morte costante (buona produzione, muoiono per vari " normali "ragioni, questo è il caso della maggior parte degli HDD), e infine quelli robusti che vivono un po 'più a lungo della maggior parte degli HDD e alla fine muoiono subito dopo quelli" normali "(ad esempio: HDD fortunati, non troppo usati, condizioni ambientali ideali, ecc.). Pertanto, sei sicuro che il tuo HDD morirà.
Perché gli HDD muoiono così spesso? Voglio dire, i dati sono scritti su un disco magnetico e il campo magnetico può durare decenni prima di scomparire. Il motivo per cui muoiono è perché il supporto di memorizzazione (disco magnetico) e l' hardware di lettura (scheda elettronica + testa rotante) sono accoppiati : non possono essere dissociati, non è possibile estrarre il disco magnetico e leggerlo con un'altra testa, perché prima la scheda elettronica (che converte i dati fisici in digitale) è diversa per quasi ogni HDD (anche dello stesso marchio e riferimento, dipende dalla fabbrica di origine) e il meccanismo interno con la testa rotante è così intricato che al giorno d'oggi è impossibile per un essere umano posizionare perfettamente una testa rotante su dischi magnetici senza ucciderli.
Inoltre, gli HDD sono noti per smagnetizzarsi nel tempo se non utilizzati (incluso SSD). Pertanto, non puoi semplicemente archiviare i dati su un disco rigido, archiviarli in un armadio e pensare che manterrà i dati senza alcuna connessione elettrica: devi collegare il tuo HDD a una fonte elettrica almeno una volta all'anno o per coppie di anni . Pertanto, gli HDD non sono chiaramente adatti per la conservazione a freddo.
Nastri magnetici : sono spesso descritti come il punto di partenza per le esigenze di backup e per estensione per l'archiviazione. Il problema con i nastri magnetici è che sono MOLTO sensibili: le particelle di ossido magnetico possono essere facilmente deteriorate dal sole, dall'acqua, dall'aria, dai graffi, smagnetizzate dal tempo o da qualsiasi dispositivo elettromagnetico o semplicemente cadere nel tempo o stampare . Ecco perché di solito vengono utilizzati solo nei data center da professionisti. Inoltre, non è mai stato dimostrato che possano conservare i dati per più di un decennio. Quindi, perché sono spesso consigliati per i backup? Perché erano a buon mercato: ai tempi, costava da 10 a 100 volte in meno per usare i nastri magnetici rispetto agli HDD, e gli HDD tendevano a essere molto meno stabili di adesso. Pertanto, i nastri magnetici sono principalmente consigliati per i backup a causa della convenienza economica, non a causa della resilienza, che è ciò che ci interessa di più quando si tratta di archiviare i dati.
Le schede CompactFlash e Secure Digital (SD) sono note per essere abbastanza robuste e robuste, in grado di sopravvivere a condizioni catastrofiche .
Le schede di memoria nella maggior parte delle fotocamere sono praticamente indistruttibili, secondo la rivista Digital Camera Shopper. Sono sopravvissuti cinque formati di schede di memoria bolliti, calpestati, lavati e inzuppati nel caffè o nella cola.
Tuttavia, come qualsiasi altro supporto a base magnetica, si basa su un campo elettrico per conservare i dati e, quindi, se la scheda si esaurisce, i dati potrebbero andare completamente persi. Pertanto, non è perfetto per l'archiviazione a freddo (poiché è necessario riscrivere occasionalmente tutti i dati sulla scheda per aggiornare il campo elettrico), ma può essere un buon supporto per i backup e l'archiviazione a breve o medio termine.
Supporti ottici: i supporti ottici sono una classe di supporti di memorizzazione che si affidano al laser per leggere i dati, come CD, DVD o Blu-ray (BD). Questo può essere visto come un'evoluzione della carta, ma scriviamo i dati in una dimensione così piccola, che avevamo bisogno di un materiale più preciso e resistente della carta, e i dischi ottici sono proprio questo. I due maggiori vantaggi dei supporti ottici è che il supporto di memorizzazione è disaccoppiato dall'hardware di lettura (ovvero, se il tuo lettore DVD non funziona, puoi sempre acquistarne un altro per leggere il tuo disco) e che si basa sul laser, che lo rende universale e a prova di futuro (cioè, fintanto che sai come realizzare un laser, puoi sempre modificarlo per leggere i pezzi di un disco ottico mediante emulazione, proprio come CAMILEON ha fatto per il progetto BBC Domesday ).
Come ogni tecnologia, le nuove iterazioni non solo offrono una maggiore densità (spazio di archiviazione), ma anche una migliore correzione degli errori e una migliore resilienza contro il degrado ambientale (non sempre, ma generalmente vero). Il primo dibattito sull'affidabilità del DVD è stato tra DVD-R e DVD + R, e anche se i DVD-R sono ancora comuni al giorno d'oggi, i DVD + R sono riconosciuti come più affidabili e precisi . Ora ci sono dischi DVD di qualità da archivio, appositamente realizzati per la conservazione a freddo, sostenendo che possono resistere per un minimo di ~ 20 anni senza alcuna manutenzione:
Il DVD-R Verbatim Gold Archival [...] è stato valutato come il DVD-R più affidabile in un accurato stress test a lungo termine da parte della rinomata rivista tedesca c't (c't 16/2008, pagg. 116-123 ) [...] raggiungendo una durata minima di 18 anni e una durata media da 32 a 127 anni (a 25 ° C, 50% di umidità). Nessun altro disco si avvicina a questi valori, il secondo miglior DVD-R ha una durata minima di soli 5 anni.
Da LinuxTech.net .
Inoltre, alcune aziende specializzate in molto lungo di archiviazione termine DVD e ampiamente a commercializzare, come il modello M-Disc dal Millenniata o DataTresorDisc, sostenendo che essi possono conservare i dati per oltre 1000 anni, e verificati da alcuni (non indipendenti) studi (da 2009) tra gli altri meno scientifici .
Tutto questo sembra molto promettente! Sfortunatamente, non ci sono abbastanza studi scientifici indipendenti per confermare queste affermazioni e le poche disponibili non sono così entusiaste:
L'umidità (80% RH) e la temperatura (80 ° C) hanno accelerato l'invecchiamento su diversi DVD nell'arco di 2000 ore (circa 83 giorni) di test con il controllo regolare della leggibilità dei dati:
Traduzione dall'istituto francese per l'archiviazione dei dati digitali (Archives de France), studio dal 2012.
Il primo grafico mostra il DVD con una lenta evoluzione della degradazione. Il secondo DVD con curve di degrado rapido. E il terzo è per DVD speciali "a lungo termine" come M-Disc e DataTresorDisc. Come possiamo vedere, le loro prestazioni non si adattano perfettamente alle affermazioni, essendo inferiori o alla pari con i DVD standard di qualità non archivistica!
Tuttavia, i dischi ottici inorganici come M-Disc e DataTresorDisc ottengono un vantaggio: sono abbastanza insensibili al degrado della luce:
Invecchiamento accelerato con luce (750 W / m²) per 240 ore:
Questi sono grandi risultati, ma un DVD di qualità archivistica come il Verbatim Gold Archival raggiunge le stesse prestazioni e, inoltre, la luce è il parametro più controllabile per un oggetto: è abbastanza facile mettere il DVD in una scatola chiusa o un armadio, e quindi eliminando qualsiasi possibile impatto della luce. Sarebbe molto più utile ottenere un DVD molto resistente alla temperatura e all'umidità rispetto alla luce.
Lo stesso gruppo di ricerca ha anche studiato il mercato dei Blu-ray per vedere se esistesse un marchio con un buon supporto per la conservazione a freddo a lungo termine. Ecco la loro scoperta:
L'umidità e la temperatura hanno accelerato l'invecchiamento su diversi marchi Blu-ray, con gli stessi parametri dei DVD:
Invecchiamento accelerato leggero su diversi marchi BluRays, stessi parametri:
Tradotto da questo studio di Archives de France, 2012.
Due riassunti di tutti i risultati (in francese) qui e qui .
In definitiva, il miglior disco Blu-ray (di Panasonic) si è comportato in modo simile al miglior DVD di qualità archivistica nel test di umidità + temperatura, pur essendo praticamente insensibile alla luce! E questo disco Blu-ray non è nemmeno di qualità archivistica. Inoltre, i dischi Blu-ray utilizzano un codice di correzione degli errori migliorato rispetto ai DVD (essi stessi utilizzano una versione avanzata rispetto ai CD), il che riduce ulteriormente i rischi di perdita di dati. Quindi, sembra che alcuni dischi BluRay possano essere un'ottima scelta per la conservazione a freddo.
E in effetti, alcune aziende stanno iniziando a lavorare su dischi Blu-ray di archiviazione ad alta densità di grado archivistico come Panasonic e Sony, annunciando che saranno in grado di offrire da 300 GB a 1 TB di memoria con una durata media di 50 anni. Inoltre, le grandi aziende si stanno orientando verso supporti ottici per la conservazione a freddo (perché consumano molte meno risorse poiché è possibile conservarle a freddo senza alcuna fornitura elettrica), come Facebook che ha sviluppato un sistema robotico per utilizzare i dischi Blu-ray come "freddo archiviazione " per i dati a cui il loro sistema accede raramente.
Iniziativa archivistica di Long Now: ci sono altre iniziative interessanti come il progetto Rosetta Disc del museo Long Now , che è un progetto per scrivere pagine della Genesi in scala microscopica in tutte le lingue sulla terra in cui la Genesi è stata tradotta. Questo è un grande progetto, che è il primo a offrire un supporto che consente di archiviare 50 MB per celle frigorifere davvero a lungo termine (poiché è scritto in carbonio) e con accesso a prova di futuro poiché è necessario solo un ingranditore per accedere al dati (nessuna strana specifica di formato né seccature tecnologiche da gestire come il raggio viola del Blu-ray, solo bisogno di una lente d'ingrandimento!). Tuttavia, questi sono ancora fatti manualmente e quindi si stima che costino circa $ 20.000, il che è un po 'troppo per uno schema di archiviazione personale immagino.
Soluzioni basate su Internet: Ancora un altro mezzo per conservare in frigorifero i tuoi dati è in rete. Tuttavia, le soluzioni di backup su cloud non sono adatte, per la preoccupazione principale che le società di cloud hosting potrebbero non vivere finché vorresti conservare i tuoi dati. Altre ragioni includono il fatto che il backup è terribilmente lento (poiché trasferisce via Internet) e la maggior parte dei provider richiede che i file esistano anche sul tuo sistema per tenerli online. Ad esempio, sia CrashPlan che Backblaze elimineranno definitivamente i file che non vengono almeno visti una volta sul computer negli ultimi 30 giorni, quindi se si desidera caricare i dati di backup memorizzati solo su dischi rigidi esterni, sarà necessario collegare il HDD USB almeno una volta al mese e sincronizzalo con il cloud per ripristinare il conto alla rovescia. Però, alcuni servizi cloud offrono di mantenere i tuoi file indefinitamente (purché paghi ovviamente) senza un conto alla rovescia, come SpiderOak. Quindi fai molta attenzione alle condizioni e all'utilizzo della soluzione di backup basata su cloud che scegli.
Un'alternativa ai fornitori di backup su cloud è quella di noleggiare il proprio server privato online e, se possibile, sceglierne uno con il mirroring / backup automatico dei dati in caso di guasti hardware dalla loro parte (alcuni addirittura ti garantiscono contro i dati persi nei loro contratti , ma ovviamente è più costoso). Questa è un'ottima soluzione, in primo luogo perché possiedi ancora i tuoi dati, e in secondo luogo perché non dovrai gestire i guasti dell'hardware, questa è la responsabilità del tuo host. E se un giorno il tuo host fallisce, puoi comunque recuperare i tuoi dati (scegli un host serio in modo che non si chiudano durante la notte ma ti avvisino in anticipo, forse puoi chiedere di inserirli nel contratto), e rehost altrove.
Se non vuoi preoccuparti di configurare il tuo server online privato e se puoi permetterlo, Amazon offre un nuovo servizio di archiviazione dei dati, chiamato Glacier . Lo scopo è esattamente quello di conservare a freddo i dati a lungo termine: quindi, costa molto archiviare i dati su un ghiacciaio, ma costa ancora di più recuperare questi dati, poiché questo servizio è realizzato per archiviare i dati fuori portata , per non conservare i dati a cui si desidera accedere spesso. Ciò significa che questo servizio cita i prezzi per la scrittura dei dati, ma anche per la loro lettura. Questo servizio ha un costo enorme, ma potrebbe essere un buon affare per alcuni dei tuoi dati più sensibili (ad esempio: se hai alcuni file di testo o immagini che sono MOLTO sensibili, poiché questo tipo di dati è solitamente di piccole dimensioni, non ti costerà molto da conservare in un ghiacciaio).
Carenze della conservazione a freddo : tuttavia, esiste un grande difetto in qualsiasi supporto di conservazione a freddo: non esiste un controllo di integrità, poiché i supporti di conservazione a freddo NON POSSONO controllare automaticamente l'integrità dei dati (possono semplicemente implementare schemi di correzione degli errori per "guarire" un po 'di il danno dopo la corruzione si è verificato, ma non può essere prevenuto né gestito automaticamente!) perché, al contrario, su un computer, non esiste un'unità di elaborazione per calcolare / giornalizzare / controllare e correggere il filesystem. Considerando che con un computer e più unità di archiviazione, è possibile verificare automaticamente l'integrità degli archivi e, se necessario, eseguire il mirroring automatico su un'altra unità se si verifica un danneggiamento in un archivio dati (purché si disponga di più copie dello stesso archivio).
Archivio a lungo termine
Anche con le migliori tecnologie attualmente disponibili, i dati digitali possono essere conservati a freddo solo per alcuni decenni (circa 20 anni). Pertanto, a lungo termine, non si può semplicemente fare affidamento sull'archiviazione a freddo: è necessario impostare una metodologia per il processo di archiviazione dei dati per garantire che i dati possano essere recuperati in futuro (anche con cambiamenti tecnologici) e che si minimizzino i rischi di perdere i tuoi dati. In altre parole, devi diventare il curatore digitale dei tuoi dati, riparare le corruzioni quando si verificano e ricreare nuove copie quando necessario.
Non ci sono regole infallibili, ma qui ci sono alcune strategie di cura stabilite , e in particolare uno strumento magico che renderà il tuo lavoro più semplice:
- Principio di ridondanza / replica : la ridondanza è l'unico strumento in grado di ripristinare gli effetti dell'entropia , che è un principio basato sulla teoria dell'informazione. Per conservare i dati, è necessario duplicare questi dati. I codici di errore sono esattamente un'applicazione automatica del principio di ridondanza. Tuttavia, devi anche assicurarti che i tuoi dati siano ridondanti: più copie degli stessi dati su dischi diversi, più copie su supporti diversi (in modo che se un supporto fallisce a causa di problemi intrinseci, ci sono poche possibilità che anche gli altri su supporti diversi falliscano allo stesso tempo), ecc. In particolare , dovresti sempre avere almeno 3 copie dei tuoi dati, chiamati anche ridondanza 3-modulare in ingegneria, in modo che se le tue copie vengono danneggiate, puoi esprimere un voto a maggioranza semplice per riparare i tuoi file dalle tue 3 copie. Ricorda sempre il consiglio della bussola del marinaio:
È inutile portare due bussole, perché se uno va storto, non puoi mai sapere quale è corretta o se entrambi sono sbagliati. Prendi sempre una bussola o più di tre.
Correzione degli errori : questo è lo strumento magico che ti semplifica la vita e rende i tuoi dati più sicuri. I codici di correzione degli errori (ECC) sono un costrutto matematico che genererà dati che possono essere utilizzati per riparare i dati. Questo è più efficiente, perché gli ECC possono riparare molti più dati usando molto meno spazio di archiviazione rispetto alla semplice replica (ovvero, fare più copie dei tuoi file) e possono anche essere usati per verificare se il tuo file ha corruzione e persino individuare dove sono quelle corruzioni. In realtà, questa è esattamente un'applicazione del principio di ridondanza, ma in modo più intelligente della replica. Questa tecnica è ampiamente utilizzata in qualsiasi comunicazione a lungo raggio al giorno d'oggi, come 4G, WiMax e persino le comunicazioni spaziali della NASA. Sfortunatamente, sebbene gli ECC siano onnipresenti nelle telecomunicazioni, non sono in riparazione dei file, forse perché è un po 'complesso. Tuttavia, sono disponibili alcuni software, come il noto (ma ora vecchio) PAR2, DVD Disaster (che offre l'aggiunta di codici di correzione dell'errore sui dischi ottici) e pyFileFixity (che sviluppo in parte per superare le limitazioni e i problemi di PAR2). Esistono anche file system che implementano facoltativamente Reed-Solomon come ZFS per Linux o ReFS per Windows, che sono tecnicamente una generalizzazione di RAID5.
Controlla regolarmente l'integrità dei tuoi file: Hash i tuoi file e controllali di volta in volta (ad esempio, una volta all'anno, ma dipende dal supporto di archiviazione e dalle condizioni ambientali). Quando vedi che i tuoi file sono stati danneggiati, è tempo di riparare usando gli ECC che hai generato se lo hai fatto, e / o fare una nuova copia dei tuoi dati su un nuovo supporto di archiviazione. Il controllo dei dati, la riparazione della corruzione e l'esecuzione di nuove copie fresche è un ottimo ciclo di cura che garantirà la sicurezza dei dati. Il controllo in particolare è molto importante perché le copie dei tuoi file possono essere danneggiate in modo invisibile e se poi copi le copie che sono state manomesse, finirai con i file totalmente corrotti. Ciò è ancora più importante con i supporti di conservazione a freddo, come i dischi ottici, che NON POSSONO verificare automaticamente l'integrità dei dati (implementano già ECC per guarire un po ', ma non possono controllare né creare automaticamente nuove copie nuove, questo è il tuo lavoro!). Per monitorare le modifiche ai file, è possibile utilizzare lo script rfigc.py dipyFileFixity o altri strumenti UNIX come md5deep . È inoltre possibile controllare lo stato di integrità di alcuni supporti di memorizzazione come i dischi rigidi utilizzando strumenti come Hard Drive Sentinel o smartmontools open source .
Conserva i tuoi archivi su diverse posizioni (con almeno una copia fuori casa!) Per evitare eventi catastrofici nella vita reale come inondazioni o incendi. Ad esempio, un disco ottico al lavoro o un backup basato su cloud possono essere una buona idea per soddisfare questo requisito (anche se i fornitori di cloud possono essere chiusi in qualsiasi momento, purché si disponga di altre copie, si sarà al sicuro , i fornitori di cloud serviranno solo come archivio fuori sede in caso di emergenza).
Conservare in contenitori specifici con parametri ambientali controllati : per mezzi ottici, conservare lontano dalla luce e in una scatola a tenuta stagna per evitare l'umidità. Per dischi rigidi e schede SD, conservare in custodie antimagnetiche per evitare l'elettricità residua per manomettere l'unità. Puoi anche riporlo in una borsa / scatola ermetica e a tenuta stagna e conservare in un congelatore: le basse temperature rallentano l'entropia e puoi prolungare abbastanza la durata di vita di qualsiasi mezzo di conservazione del genere (assicurati solo che l'acqua abbia vinto non entrare dentro, altrimenti il tuo mezzo morirà rapidamente).
Usa hardware di buona qualità e controllali in anticipo (ad esempio: quando acquisti una scheda SD, testa l'intera scheda con un software come HDD Scan per verificare che tutto sia a posto prima di scrivere i tuoi dati). Ciò è particolarmente importante per le unità ottiche, poiché la loro qualità può cambiare drasticamente la qualità dei dischi masterizzati, come dimostrato dallo studio Archives de France (un cattivo masterizzatore DVD produrrà DVD che dureranno molto meno).
Scegli con cura i tuoi formati di file: non tutti i formati di file sono resistenti alla corruzione, alcuni sono persino chiaramente deboli. Ad esempio, le immagini .jpg possono essere completamente rotte e illeggibili manomettendo solo uno o due byte. Lo stesso vale per gli archivi 7zip. Questo è ridicolo, quindi fai attenzione al formato dei file archiviati. Come regola generale, il testo semplice e chiaro è il migliore, ma se è necessario comprimerlo, utilizzare zip non solida e per le immagini, utilizzare JPEG2 (non ancora open-source ...). Maggiori informazioni e recensioni di curatori digitali professionisti qui , qui e qui .
Conservare insieme agli archivi di dati tutti i software e le specifiche necessari per leggere i dati. Ricorda che le specifiche cambiano rapidamente e quindi in futuro i tuoi dati potrebbero non essere più leggibili, anche se puoi accedere al file. Pertanto, dovresti preferire formati e software open source e archiviare il codice sorgente del programma lungo i tuoi dati in modo da poter sempre adattare il programma dal codice sorgente all'avvio da un nuovo sistema operativo o computer.
Molti altri metodi e approcci sono disponibili qui , qui e in varie parti di Internet.
Conclusione
Vi consiglio di usare ciò che potete avere, ma rispettate sempre il principio di ridondanza (fate 4 copie!), E controllate sempre regolarmente l'integrità (quindi dovete pre-generare un database di hash MD5 / SHA1 in anticipo) e creare nuovi nuovi copie in caso di corruzione. Se lo fai, puoi tecnicamente conservare i tuoi dati per tutto il tempo che desideri, qualunque sia il tuo supporto di archiviazione. Il tempo che intercorre tra ogni controllo dipende dall'affidabilità dei supporti di archiviazione: se si tratta di un disco floppy, controllare ogni 2 mesi, se si tratta di un Blu-ray HTL, controllare ogni 2/3 anni.
Ora in condizioni ottimali, consiglio per la conservazione a freddo di utilizzare dischi HTL Blu-ray o dischi DVD di tipo archivistico archiviati in scatole opache a tenuta stagna e conservati in un luogo fresco. Inoltre, è possibile utilizzare schede SD e provider basati su cloud come SpiderOak per archiviare copie ridondanti dei dati o persino dischi rigidi se sono più accessibili.
Usa molti codici di correzione degli errori , ti salveranno la giornata. Inoltre puoi fare più copie di questi file ECC (ma più copie dei tuoi dati sono più importanti delle copie multiple di ECC perché i file ECC possono ripararsi da soli!).
Tutte queste strategie possono essere implementate usando il set di strumenti che sto sviluppando (open source): pyFileFixity . Questo strumento è stato infatti avviato da questa discussione, dopo aver scoperto che non c'erano strumenti gratuiti per gestire completamente la fissità dei file. Inoltre, fai riferimento al readme e al wiki del progetto per ulteriori informazioni sulla fissità dei file e sulla cura digitale.
In ultima analisi, spero davvero che più ricerca e sviluppo saranno posti su questo problema. Questo è un grosso problema per la nostra società attuale, avendo sempre più dati digitalizzati, ma senza alcuna garanzia che questa massa di informazioni sopravviverà per più di qualche anno. È piuttosto deprimente e penso davvero che questo problema dovrebbe essere messo molto più in primo piano, in modo che questo diventi un punto di marketing per costruttori e aziende per creare dispositivi di archiviazione che possono durare per le generazioni future.
/ EDIT: leggi sotto per una pratica routine di cura .