Archiviazione a lungo termine di dati aziendali critici


16

Questo è davvero complicato, e in una certa misura non è un problema tecnico e potrebbe non appartenere qui, ma

Server Fault è per gli amministratori di sistema ... che gestiscono o mantengono i computer a livello professionale

E lo faccio .. e questo è uno dei miei compiti .. Comunque.

Immagina di avere 5000 + pagine a doppia faccia di A4. Dati aziendali, tutti fondamentali per l'azienda.
È necessario eseguirne il backup, in qualche modo. Le soluzioni proposte finora sono:

  1. PDF -> Archiviazione online
  2. PDF -> DVD / BluRay / Tape
  3. PDF -> Unità disco fisso / SSD / Flash portatile.
  4. Acquista / Leasing / Assumi / 'Ruba' una grande fotocopiatrice e copia.
  5. ???

Problemi immediati con quanto sopra:

  1. Cosa succede se il partner di archiviazione fallisce?
  2. I DVD marciscono nel tempo. Nastri allo stesso modo.
  3. Anche questi si rompono nel tempo.
  4. Costoso. Lento. Pesante. Non adatto agli alberi.

Le domande):

Qual è il gold standard per la conservazione e l'archiviazione dei dati a medio-lungo termine? Hai risolto un problema simile sul posto di lavoro?

Dopo il caricamento iniziale, è necessario aggiungere alla raccolta circa 100 pagine al mese. Il recupero dovrebbe essere possibile, facilmente, ma probabilmente non è frequente.
Idealmente, vorrei garantire che la soluzione sarà praticabile molto tempo dopo aver lasciato l'azienda, e che non richiederà una quantità enorme per mantenerla mantenibile, quindi conservare molti molti DVD non è solo l'ideale, ma anche no una buona soluzione a lungo termine.

Mentre fare copie cartacee è sicuramente il più semplice, non è il più ecologico, non di gran lunga. Inoltre, non è molto gestibile, difficile da cercare, indicizzare e così via. Combinato con pesante e difficile da conservare fisicamente.

Mi piace molto l'idea in linea di principio di avere tutto archiviato elettronicamente, ma il meccanismo effettivo per farlo deve essere trasparente e facile. Non voglio davvero essere responsabile di questo per sempre e per un giorno, supportando gli utenti dell'ufficio mentre si accalcano e perdono documenti. Inoltre, non voglio fare affidamento su un singolo fornitore di archiviazione, e se Dropbox (abbiamo una soluzione di backup online ATM, ma non è Dropbox.) Dovesse fallire, o altrimenti sperimentare un evento catastrofico, quante aziende chi sta usando i loro servizi sarebbe il ruscello, senza pagaia?

C'è una certa flessibilità di bilancio qui, ma sospetto che tutto ciò che costa di più rispetto al nostro attuale backup online (che è come 2500 USD / anno), sarebbe visto in modo meno favorevole, rispetto al solo metterlo in una scatola da scarpe sotto un letto. Il che è senza dubbio cosa accadrebbe se non facessi nulla e mi dimettessi domani.

Qualche idea?

-Modificare-

La ragione per farlo è duplice.

1) fornire un backup sicuro ragionevole delle pratiche burocratiche aziendali in caso di incendio dell'ufficio.

2) per soddisfare le leggi sull'archiviazione dei dati WRT nel Regno Unito in materia fiscale per le aziende e così via.

Modifica 2:

Avere qualche meccanismo per indicizzare i documenti sarebbe anche dannatamente utile ..


Ho messo a punto una breve sceneggiatura per fare PDF-> Txt con ghostscript e gocr. Oziosamente considerando di spruzzare tutto in un db SQLlite per creare un indice interessante per i dati.
Tom O'Connor

La ridondanza (dei media digitali) e il mantenimento della ridondanza nel corso degli anni possono essere i tuoi migliori amici.
Vortico,

Risposte:


5

Mantenere i dati in un formato come PDF è probabilmente sicuro, perché ci sono strumenti gratuiti per leggerli. Il volume di dati di cui stai parlando è piuttosto piccolo (1.200 pagine / anno), quindi anche con una risoluzione di scansione di 300 dpi stai parlando solo di decine di gigabyte all'anno.

Tuttavia, il problema del dispositivo di archiviazione fisico non scomparirà mai. Qualunque supporto utilizzato per archiviare dati elettronici (nastro, ottica, ecc.) Dovrà eventualmente essere aggiornato a un supporto più recente. Pianifica e budget per "dare il via ai dati" verso nuovi formati poiché i nuovi formati sostituiscono i formati precedenti.

Probabilmente considererei i supporti ottici come la prima scelta semplicemente perché hai così pochi dati. Pianificherei anche di masterizzare 3x duplicati di tutto e di aggiornare i media ogni 2-3 anni.

Se il supporto ottico è troppo piccolo, sceglierei un nastro LTO e aggiornerei il supporto ogni 4-5 anni. Sarà piuttosto costoso, tuttavia, per una quantità così piccola di dati.


DVD? O Blu-ray? BR è ancora un formato ragionevole per i dati?
Tom O'Connor

1
@ Tom O'Connor: mi sembrano uguali. Guarderei i costi per prendere quella decisione. Ora ci sono spazi Blu-Ray di tipo "archivistico" là fuori, quindi da un punto di vista tecnico sembra un formato praticabile. (I produttori che affermano che i supporti Blu-Ray hanno una durata "stimata" di 200 anni non mi danno più fiducia di quelli che hanno affermato che i supporti DVD archivistici hanno avuto una durata "stimata" di 100 anni ...)
Evan Anderson

Ho alcuni CD-R GOLD Kodak del 1998 o giù di lì, e sono ancora leggibili. Ne ho anche alcuni gratuiti, in cui lo strato di colorante si è separato e sono avvitati.
Tom O'Connor

Non sto suggerendo che non vi sia alcuna differenza nei media archivistici rispetto ai media non archivistici. Sto semplicemente dicendo che i supporti Blu-Ray per l'archiviazione rispetto ai DVD per l'archiviazione non sembrano molto diversi da me. Il confronto tra il grado di archiviazione e il "media di 100 per $ 20,00" è una storia completamente diversa.
Evan Anderson,

Un elemento non menzionato era la memoria a stato solido (chiavette USB): più grande dell'ottica, più piccola dell'LTO. È probabile che l'USB sia in circolazione da almeno un altro decennio o due, e una pen drive da 16 GB o 32 GB (o due o tre) è piuttosto economica in termini di costi di archiviazione. Dal momento che sta per scrivere, una volta letto, molti non ti devi preoccupare delle cellule SSD che si consumano, quindi in teoria potresti tenere i bastoncini per 5 o più anni in un caveau ignifugo.
voretaq7,

6

Esistono sistemi specifici che utilizzano internamente i DVD e migrano i dati su nuovi media ogni tanto. Cerca la conservazione digitale.

Poiché i requisiti di archiviazione aumentano abbastanza rapidamente, è consigliabile passare comunque a un tipo di supporto più nuovo e più grande ogni pochi anni.

Supponendo di ottenere i dati in forma cartacea, è necessario:

  1. Elencare i dati alla voce di posta. Ciò può significare assegnare a ciascun foglio un codice a barre univoco.
  2. Scansionalo. Utilizzare l'identificatore del codice a barre come nome file. Archivia il documento.
  3. Archivia i dati. Metti i dati su un sistema di archiviazione sicuro di revisione. Un file server non sarà abbastanza buono perché potrebbe accadere qualcosa ai file se sono accessibili in scrittura.
  4. Renderlo accessibile per altri sistemi.

Nel caso dei clienti, sono tutte le fatture per le grandi organizzazioni che devono essere trasferite al sistema online (SAP). Ormai l'archiviazione ha subito diverse iterazioni. Attualmente si stanno spostando verso il raggio blu.

D'altra parte, al giorno d'oggi tutto va sui dischi, quindi forse qualcosa del genere sarebbe la tua strada da percorrere: http://www.eurostor.com/german/iTernity.D.php


Tieni presente che la maggior parte dei DVD-R (et al) dura solo pochi anni prima del degrado. Le costose "archiviazioni" durano più a lungo se conservate secondo le istruzioni.
Chris S

Così fanno la maggior parte dei dischi, server, file system o formati di documenti. Archiviare significa spostare i dati. Prova a leggere un pdf tra 20 anni. Ricordi quale era lo standard 10 anni fa? Non abbiamo nulla che si avvicini alla carta, davvero. Tranne che per copia e incolla ...
Posipiet

I documenti di puro testo sono ancora abbastanza leggibili.
Bart Silverstrim,

Esistono strumenti gratuiti per leggere i PDF. Finché sono "semplici vaniglia" non sarei troppo preoccupato. Anche TIFF è una buona opzione.
Evan Anderson

3

La nostra soluzione: Scan to PDF -> Backup su nastro

Abbiamo uno scanner di documenti, fa ~ 30 pagine / min e produce file PDF OCR. Eseguiamo il backup di quelli su nastro (in particolare LTO4) che hanno una durata compresa tra 50 e 100 anni (la ricerca di un'unità nastro potrebbe essere difficile nel periodo di tempo, ma ci sono luoghi di recupero dei dati che ripristineranno comunque i dischi floppy da 8 ").


2
Ho dovuto Google 8 "floppy ....
Holocryptic

Conservo i miei nastri di backup da Mac OS 7.5. Ma il disco si è rotto, il supporto dei programmi di backup è perso. Sono riuscito a reinstallare il Mac, ma non riesco a leggere il nastro perché non ho il programma di backup. E francamente, non ricordo nemmeno il suo nome. Sì, il nastro potrebbe durare 100 anni. Ma il lettore non lo fa.
Posipiet

@Holocryptic: Solo pochi mesi fa ho buttato fuori una scatola non aperta di floppy disk da 8 "settorizzati rigidi Verbatim.
user9517

1
@Holocryptic: NSFW! NSFW !!
Bart Silverstrim,

@Posipiet, penso di aver coperto il fatto che le unità non durano per sempre ma ci sono aziende specializzate nel recupero di dati da qualsiasi supporto comunemente usato.
Chris S

3

Penso che il nuovo servizio Glacier di Amazon sia un'offerta interessante in questo spazio.

Amazon Glacier è ottimizzato per i dati a cui si accede raramente e per i quali sono adatti tempi di recupero di diverse ore. Con Amazon Glacier, i clienti possono archiviare in modo affidabile grandi o piccole quantità di dati per un minimo di $ 0,01 per gigabyte al mese, un notevole risparmio rispetto alle soluzioni locali.


2
I costi di recupero sono follemente immensi.
Tom O'Connor,

2

Primo passo, Backup: OCR i documenti, quindi riorganizza tutte le parole in una serie di romanzi sulla Chiesa cattolica, l'Opus Dei e i Templari. Dovresti avere dati di input sufficienti per circa 10 romanzi e circa uno in più ogni anno circa per sempre. Mantenere una tabella di ricerca che contiene le parole posizione originale nei documenti di origine (nell'ordine di origine) e la posizione finale nei romanzi; memorizzare le parole duplicate in una voce della tabella. Assicurati un contratto di pubblicazione e pubblica milioni di romanzi. Utilizzare le entrate delle vendite di libri per finanziare l'OCR e l'operazione di riorganizzazione delle parole. Distruggere i documenti originali e venderli come lettiera per criceti. Occasionalmente potrebbe essere necessario effettuare ordini di acquisto per crocifissi, biglietti anti-materia o aerei per località esotiche, se si riscontra che manca il vocabolario dei documenti di input.

Fase due, Ripristino / accesso: non è necessario archiviare copie dei dati: tutto ciò che serve è la tabella di ricerca e una libreria di seconda mano.

Poiché la tabella di ricerca è il tuo unico punto di errore, dovrai comunque eseguire il backup. Grazie allo schema di codifica huffman impiegato, questo sarà piuttosto piccolo, rispetto ai tuoi documenti di input, quindi probabilmente potrebbe essere copiato su DVD. Per il backup fuori sede, siediti di fronte a un caminetto e leggi la tabella di ricerca, mentre fai il video. Posiziona il tuo pezzo di performance video sulla fusione di arte e tecnologia nella Tate Modern Gallery, in mostra permanente.


1

Un po 'troppo presto per acquistarlo, ma sembra che l'HDS abbia messo a punto un meccanismo permanente di archiviazione dei dati basato sul quarzo: prendi un READ .


1
Ho sentito la permanenza affermare così tante volte che non ci crederò mai e nessuno di noi vivrà abbastanza a lungo da vederlo mai provato. Le previsioni di permanenza sono assolutamente prive di valore e invariabilmente vengono smentite.
John Gardeniers,

-2

Devo presentare Humyo.com (acquistato da Trend Micro - il cui secondo nome è sicurezza)

Crittografano tutti i dati degli utenti e i loro server sono alloggiati nella Banca d'Inghilterra in un caveau.

Abbastanza sicuro :)


1
Scommetto che in realtà non sono nella Bank of England. Non c'è spazio lì dentro, è pieno di banchieri.
Tom O'Connor,

5
Trend Micro, il cui secondo nome è bloatware ...
Tom O'Connor

Sono d'accordo con te su Trend Micro ma lo possiedono solo, tu operi con il software
Humyo
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.