Qual è il formato di archivio più affidabile?


25

Vorrei eseguire il backup di alcune vecchie cartelle con documenti ai quali solo raramente ho bisogno di accedere. Per questo, vorrei metterli tutti in un archivio. Poiché si tratterà di un backup, il formato dovrebbe adattarsi a tale scopo. Quindi, linea di fondo:

Qual è il formato di archiviazione più affidabile / robusto in Ubuntu?

Risposte:


20

Dipende. Le due opzioni più popolari sono tarball e file zip, ma mancano entrambi:

  • .tar gli archivi su nastro sono un'opzione molto popolare per la maggior parte degli utenti Linux. Conserva le autorizzazioni dei file UNIX (che è importante per un backup) e i collegamenti reali. È supportato immediatamente su ogni distribuzione Linux che ho testato, così come alcuni programmi Windows come 7-zip . Tuttavia, tar presenta diversi limiti e svantaggi per il caso d'uso del backup, come spiegato dagli sviluppatori di Duplicity . Può essere molto lento: anche per ottenere un elenco di nomi di file memorizzati nell'archivio, l'intero archivio deve essere letto. Inoltre, non gestisce metadati dettagliati di alcuni file system più recenti.
  • .zip i file zip fungono sia da archivio che da formato di compressione. Per la velocità, puoi disabilitare completamente la compressione. I file zip sono migliori degli archivi su nastro in quanto archiviano un tipo di sommario, consentendo ai programmi di passare rapidamente al file specifico che devono estrarre. Memorizza inoltre checksum per il contenuto di ciascun file, per consentire un facile rilevamento della corruzione dei file. I file zip sono estremamente popolari, sfortunatamente, non sono adatti per i backup di Linux perché non memorizzano semplici autorizzazioni per i file.

Ecco altre due opzioni che purtroppo mancano anche:

  • .7z Gli archivi compressi 7z hanno alcune caratteristiche eccellenti come la crittografia e il supporto per file molto grandi. Sfortunatamente, non memorizza le autorizzazioni dei file UNIX, quindi non è adatto per i backup di Linux.
  • .ar gli archivi UNIX classici sono il predecessore degli archivi tar e presentano gli stessi limiti degli archivi tar.

A mio avviso, non esiste un formato di archivio di backup completamente affidabile per i backup di Linux, nessuno che sia sufficientemente noto per garantire la mia fiducia, in ogni caso.

Un modo per superare i limiti di ciascuno di questi formati è combinarli: ad esempio, archiviare ciascun file singolarmente in un archivio tar, quindi archiviare tutti questi tarball in un file zip.

Se desideri un backup davvero affidabile, dovresti probabilmente esaminare queste soluzioni:

  • eseguire il backup direttamente su un disco rigido esterno, con lo stesso file system sia su origine che su destinazione. Ciò garantisce che memorizzerete le autorizzazioni e i metadati di ciascun file esattamente come previsto. (A parte, i proprietari e i proprietari dei gruppi di file vengono archiviati utilizzando i loro numeri di userid e groupid, non i loro nomi.)

  • Utilizzare il software di imaging e clonazione dell'intero disco, come CloneZilla . Non è possibile recuperare un file da uno di questi backup, ma si può essere assolutamente sicuri di aver salvato tutto il possibile.

E ricorda, ricorda sempre: puoi essere sicuro dei tuoi backup solo se hai tentato di ripristinarli. Se il peggio dovesse peggiorare e il tuo disco rigido di origine fosse completamente distrutto, potresti ripristinare tutto ciò che ti serve per ripristinare un nuovo disco rigido? Funzionerebbe come previsto? Prova a ripristinare il backup su un nuovo disco rigido e prova a eseguire da quel disco rigido per un paio di giorni. Se noti che manca qualcosa, sai che il tuo backup non è stato abbastanza approfondito.

Pensa anche a dove stai mantenendo i tuoi backup. È necessario almeno alcuni backup che non si trovano nello stesso edificio dei dischi di origine per proteggersi da furti o incendi. Alcune opzioni per questo sono il cloud o la casa di un amico.


Grazie per questa buona spiegazione dei pro e dei contro TAR / ZIP! Molto utile.
Pisu,

9

Un tarball ( .tarfile) sarebbe la strada da percorrere. Usa il gzipformato di compressione per una compressione minore, ma una buona velocità. bzip2è molto più lento ma offre un miglior rapporto di compressione. Per i dati binari, tuttavia, non c'è una grande differenza.

Il comando per comprimere una directory usando la compressione gzip:

tar czf /path/to/save/backup.tar.gz directory-to-backup

Per estrarre un tarball compresso con gzip preservando le autorizzazioni dei file:

tar xzpf /path/to/save/backup.tar.gz

Sostituisci zcon jper la compressione bzip2 e aggiungi vprima v (es. czvfE xzpvf) per stampare i nomi dei file mentre vengono archiviati / estratti.


4
Per affidabilità, non si desidera alcuna compressione. Qualsiasi danno a un archivio compresso causerà la perdita di tutto ciò che segue il punto di danno.
psusi,

5
@psusi Questo non è vero per bzip2, che comprime in blocchi di ~ 1 MB. Dai un'occhiata bzip2recover.
phihag,

@phihag, pulito, dopo tutti questi anni non me ne ero accorto! +1. Un ottimo motivo per bzip2 su gzip.
psusi,

7

Scelgo 7zip ( sudo apt-get install p7zip-full). Dal mio punto di vista sembra un archiviatore di compressione ideale.

Non mi piacciono i tarball classici per la loro goffaggine in quanto l'intero file tar deve essere decompresso (cosa che può accadere dietro le quinte, ma comunque accade) solo per visualizzare il sommario dell'archivio.


4

Sebbene non sia così noto o ampiamente usato, sarei propenso ad andare con afio a causa del modo in cui comprime i file individualmente, rendendo così possibile il recupero in caso di corruzione. Installa tramite aptitude o simili.


1

Tarball compresso con gzip (.tar.gz, .tgz), standard di archiviazione Linux. Non puoi sbagliare.

Mai nella mia vita ho avuto un archivio .tar.gz corrotto o addirittura fastidioso. In FlatmateRooms lo utilizziamo per archiviare centinaia di migliaia di immagini sul server e tutti i backup.


0

In alcuni casi questo è utile per me.

tar -cJvf paquete.tar.lzma folder-to-backup/
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.