Programma di compressione file più efficiente per molti file identici?


12

Sto facendo un backup del mio lavoro e sto cercando un programma in grado di comprimere i file in modo più efficiente. Il programma di compressione predefinito di Windows funziona bene, ma non funziona come "intelligente" come vorrei.

I miei file sono sostanzialmente intere istantanee del mio lavoro scattate negli ultimi mesi mentre eseguo i miei backup completi regolari. non molti cambiamenti tra i backup e molti file sono semplicemente copie l'uno dell'altro.

Il mio intero set di file è circa 15 GB non compresso, mentre i singoli backup di snapshot (compressi utilizzando programmi di compressione standard) sono compresi tra 150 e 200 MB ciascuno (in genere aumentano di dimensioni con date più recenti). La dimensione totale di tutte le istantanee compresse è di circa 3 GB. A causa della natura dei file, mi aspetto che un programma di compressione "intelligente" riduca l'intero volume a circa 400-500 MB, ovvero tenendo conto delle inefficienze ragionevoli e dello spazio aggiuntivo per comprimere le differenze nei file.

Esiste un programma di compressione che sfrutterà il fatto che molti file sono identici per ottenere un rapporto di compressione molto più elevato rispetto al programma di compressione Windows standard?

Grazie

Modifica: appena terminata una migliore compressione dell'intero volume usando la compressione standard di Windows. È solo 10 MB meglio delle istantanee compresse combinate. Secondo me è inaccettabile conoscere la natura dei file.


Su quale versione di Windows?
John T

1
Heh, its

3
Passare al controllo versione invece di quei backup sarebbe meglio? Sto usando git anche per i file binari e funziona davvero bene. Non penso che potrebbe comprimerlo fino a 7z, ma importa se ci vogliono 150 MB o 300 MB? Altrimenti, sceglierei la facilità d'uso e la flessibilità.
maaartino

Risposte:


18

7-zip supporta una compressione solida se ricordo bene, quindi dovrebbe comprimere molti file quasi identici molto bene.


2
+1 e considera il formato 7z predefinito .
nik

Ci proverò, ti risponderò con i risultati.

2
Dopo 1 ora di compressione con le impostazioni più alte ho ottenuto una dimensione del file di 133 MB. Questo è davvero impressionante! La mia stima aggressiva originale (che non ho indicato) era una dimensione del file di circa 150 MB (contrariamente alla mia stima conservativa dichiarata di 400-500 MB). Sembra che da ora in poi mi convertirò a 7z!

Anche se è necessario attenersi al formato Zip standard, 7-zip offre una resa migliore rispetto ad altri popolari strumenti di compressione (WinRAR, WinZip) con l'impostazione di massima efficienza.
christophem,

7 zip è letteralmente uno dei primi strumenti che ho inserito in una nuova scatola. È semplicemente troppo utile.
corsiKa

6

Ho fatto alcuni test sull'aspetto di "file identici", come menzionato nella domanda, usando 7-zip (versione 9.20), dato che nessuno ha ancora dato una risposta elaborata al riguardo. Ciò ha dato alcuni risultati interessanti. Ho provato con 10 copie del file che questo sito utilizza per il suo messaggio di pagina non trovata . Questo file non si comprime molto bene come singolo file, essendo un file jpg. Quindi, dimostrerà l'efficienza della compressione di più file identici. La dimensione del file è di 37 KB.

  1. Quando comprimo tutte e dieci le copie, usando in formato zip, la dimensione del file è 367 KB, con una dimensione compressa di circa il 99% della dimensione totale originale di tutti i 10 file.
  2. Quando comprimo tutte e dieci le copie, usando il formato 7z, la dimensione del file è di 37 KB, con una dimensione compressa di circa il 101% di uno solo dei file originali.
  3. Se prima inserisco 5 copie in un archivio 7-z, quindi aggiungo 3 e infine 2 copie in passaggi separati, la dimensione del file diventa 111 KB, circa tre volte la dimensione di un singolo file originale.

Se apro il 3 ° archivio, una delle proprietà è Blocco . Questo elenca 0, 1 e 2 per 3, 5 e 2 dei file, rispettivamente.

osservazioni:

  1. Il formato zip comprime ogni singolo file, non beneficiando della possibilità di comprimere in modo efficiente file identici.
  2. Il formato 7z comprime in modo efficiente più file identici, purché vengano aggiunti all'archivio in un solo passaggio.

conclusioni:

  1. Per compressioni ottimali di file, utilizzare 7z anziché zip.
  2. La compressione può migliorare notevolmente se non si aggiungono file a un archivio 7z esistente, ma prima si decomprime e lo si comprime di nuovo, inclusi i nuovi file, in un solo passaggio.

1

Windows Vista viene fornito con Centro backup e ripristino . Eseguirà backup incrementali dei tuoi file per evitare di sprecare spazio e dover creare più backup. Dalla pagina collegata:

Le versioni precedenti dei file di backup utilizzano solo uno spazio minimo su disco. Se cambia solo una piccola parte di un file (come una diapositiva in una presentazione), solo quella parte viene tracciata e salvata.


1

7-zip ha uno dei migliori algoritmi di compressione in circolazione. Non credo che al momento ci sia qualcosa che batte 7-zip in compressione (algoritmo) finora.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.