Quali impostazioni utilizzare quando si creano file 7zip per ottenere la massima compressione durante la compressione di PDF?


15

Quali impostazioni usare quando si creano file 7zip per ottenere la massima compressione? Sto comprimendo documenti PDF contenenti immagini scansionate. Sto pensando di utilizzare LZMA2, ma non so cosa impostare in dimensioni del dizionario, dimensioni delle parole, ecc. Inoltre, LZMA o PPMd sarebbero opzioni migliori?

Ho bisogno di trasferire alcuni file (~ 200 MiB) su rete e le velocità di upload qui sono molto lente, quindi vorrei comprimere il più possibile i dati. Il tempo impiegato dalla CPU non è molto importante.

MODIFICARE

Ecco cosa ho ottenuto dopo aver testato vari metodi di compressione:

Le dimensioni non compresse erano: 25.462.686 B

Il mio processore è Intel Core 2 Due T8100 e ho 4GiB di RAM.

La migliore compressione è stata con PeaZip usando l'algoritmo PAQ8O. La dimensione del file risultante era 19.994.325 B. Le impostazioni utilizzate erano livello di compressione: massimo. Sfortunatamente, la velocità di compressione era di circa 5 KiB / s, quindi ci sono voluti più di un'ora per comprimere i dati.

Il prossimo è stato il compressore PAQ9O sperimentale. Usandolo, ho ottenuto 20.132.660 B in circa 3 minuti di compressione. Sfortunatamente, il programma è solo a riga di comando e non molti altri programmi usano questo algoritmo di compressione. Utilizza anche circa 1,5 GB di RAM con le impostazioni che ho usato (a -9 -c)

Dopo di che era 7-Zip 9.15 beta (2010-06-20) usando LZMA2. Usandolo, ho ottenuto 20.518.802 B in circa 3 minuti. Le impostazioni utilizzate erano la dimensione della parola 273, la dimensione del dizionario 64 MB e ho usato 2 thread per la compressione.

Ora torniamo alla mia domanda originale: nel mio caso la dimensione del blocco solido non ha prodotto risultati evidenti. L'aumento della dimensione delle parole ha prodotto alcuni risultati. La differenza tra la dimensione massima della parola e la più piccola era di 115.260 B. Credo che tali risparmi giustifichino gli sforzi necessari per fare due clic necessari e modificare la dimensione delle parole.

Ho provato ad utilizzare altri algoritmi di compressione supportati da 7zip e PeaZip e producono file di dimensioni comprese tra 19,8 MiB e 21,5 MiB.

Alla fine la mia conclusione è che quando si comprimono documenti PDF contenenti principalmente immagini, lo sforzo necessario per utilizzare algoritmi di compressione esotici non è giustificato. La compressione con LZMA2 in 7zip ha prodotto risultati abbastanza accettabili nel minor tempo possibile.


Cosa c'è di diverso nell'usare PeaZip? È solo un wrapper della GUI intorno a 7zip e molti altri strumenti
Cole Johnson,

@Cole "Cole9" Johnson Beh, la differenza è che nel mio caso ho usato alcuni "altri" strumenti di PeaZip che al momento non avevano una GUI. Se ricordo correttamente allora solo PeaZip offriva l'algoritmo PAQ8O con una GUI.
AndrejaKo

Risposte:


7

Il contenuto dei PDF (testo e immagini) è probabilmente già compresso, quindi non ci sarà molto da guadagnare provando a comprimerli di nuovo.


3
Beh no. Ho fatto un po 'di test e ho preso 24 MiB di PDF e li ho compressi usando le impostazioni predefinite. Il risultato è stato un file 19 MiB. Nel mio caso, quei 5 MiB contano nel mio caso.
AndrejaKo

1
Sembra che tu abbia ragione. Non sono riuscito a produrre risultati significativamente migliori rispetto alle impostazioni predefinite di 7zip, indipendentemente da ciò che ho fatto. Sono ancora convinto che una certa compressione sia migliore di nessuna.
AndrejaKo

3
Se potessi risparmiare così tanto spazio, probabilmente c'è del lavoro da fare con i PDF stessi per risparmiare quasi tutto quello spazio senza 7-Zip. Un viaggio attraverso l'ottimizzatore PDF di Acrobat può fare miracoli.
Afrazier

Vedi la risposta di usr: la compressione utilizzata in PDF (zlib) può essere ripristinata per comprimerla ulteriormente (e applicarla di nuovo sulla ricostruzione). Ciò si traduce spesso in una riduzione delle dimensioni del 50% circa
schnaader,

@schnaader: è davvero interessante. Ho visto e usato strumenti come PDF Optimizer di Acrobat e MuPDF per modificare i PDF mantenendoli visualizzabili, ma essere in grado di trasformarli senza perdita in questo modo è anche molto prezioso e può essere utilizzato con grande vantaggio.
Afrazier

8

Prova a precompilare : prima decomprime i dati già compressi all'interno dei tuoi PDF. Quindi 7z può fare la sua magia su dati non compressi.

Prova anche nanozip che ho verificato essere molto efficace, ma molto efficiente (400kb / s con rapporti di compressione degli algoritmi PAQ).


2

7za a -t7z -mx-9 -mfb = 258 -mpass = 15 nomefile.7z sottodir

Regola la prima parola in base alle necessità per il nome dell'eseguibile della riga di comando e modifica le parti dopo "-mpass = 15" per personalizzare il tuo nome file e ciò che dovrebbe includere.

Questa risposta non è specifica per i documenti PDF.
Questo utilizza LZMA, non PPM. Sono stato lontano da PPM perché ci sono troppe varianti non compatibili con altre varianti. LZMA sembra essere più stabile, con la compatibilità ampiamente supportata. Quindi sono rimasto lontano da PPM proprio perché la mia opinione era, come hai affermato, "lo sforzo necessario per utilizzare algoritmi di compressione esotici non è giustificato".


2
LZMA2 è significativamente migliore di LZMA ma è per (efficace) uso solo su sistemi a 64 bit.
OMY,

-3

La compressione lzma è la migliore perché puoi creare un file sfx o un pacchetto msi con un alto rapporto di compressione. nel tuo caso non stai comprimendo un file di grandi dimensioni, quindi la differenza è piuttosto piccola soprattutto se il file è stato compresso come: mp3 o png

prova a vincere arco è gratuito e offre un rapporto di compressione gret

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.