Che cosa fa aumentare le dimensioni del file PDF quando si salva in Anteprima?


17

Sembra che apportare modifiche, annotazioni o anche solo l'apertura e il salvataggio di un file PDF in Anteprima provocherà un aumento significativo delle dimensioni del file. Ho notato che per alcuni libri che ho scannerizzato ciò accade anche per migliorare i tempi di rendering della pagina.

Qualcuno può fare luce su cosa sta succedendo per causare questi cambiamenti? Sono interessato a sincronizzare le annotazioni degli ebook PDF tra Preview e iPad (forse GoodReader) ma questo potrebbe essere troppo poco pratico con file PDF di grandi dimensioni.


2
Ciò è probabilmente dovuto al modo in cui hanno deciso di codificare i PDF in anteprima. I PDF sono ora un formato aperto ma ciò non significa necessariamente che tutti li stiano codificando allo stesso modo. La tua scommessa più sicura è ottenere un editor Adobe PDF e usarlo. Secondo queste persone, discuss.apple.com/thread/3896311?start=0&tstart=0 , fa la differenza. Discutono anche delle possibili ragioni alla base del problema.
Tony

Risposte:


12

Nel suo romanzo poco conosciuto, PDF Karenina , Leo Tolstoy ha scritto,

I file PDF con codifica ottimale sono tutti uguali; ogni file PDF codificato in modo subottimale è codificato in modo subottimale a modo suo.

E 'difficile per chiunque di risposta perché i tuoi file PDF sono più grandi dopo Preview modifica di loro. Un file PDF è costituito da diversi tipi di dati: immagini, flussi di contenuti, caratteri, sovraccarico di documenti, spazi colore, stati grafici estesi e una tabella di riferimenti incrociati. Proprio come una frase potrebbe essere concisa e un'altra dettagliata, ma entrambe sono in inglese valido e dicono la stessa cosa, così anche un file PDF potrebbe avere un modo più dettagliato di rappresentare lo stesso contenuto di un file PDF più conciso. Dovremmo guardare i tuoi esatti file PDF. È probabile che siano stati creati da una varietà di diversi software, alcuni consise, altri meno.

Indica anche quale versione di Mac OS X e Anteprima stai utilizzando, perché questo determina il software che scrive il nuovo file PDF quando esegui un Salva con nome in Anteprima.

Posso, tuttavia, dirti cosa aumenta di alcuni dei miei file PDF. Questa storia si applica al mio computer, con Mac OS X 10.5.8 e Apple Preview 4.2 (469.5).

Un file, Giulio.pdfè un documento di 22 pagine con testo come testo, non immagini scansionate. Ha una dimensione di 461.092 byte. L'ho aperto in Anteprima, fatto File ... Salva con nome ... e salvato con un nuovo nome di file. Il nuovo file ha 724.421 byte o il 57% in più.

Ho aperto ogni file con Adobe Acrobat Professional, versione 8.3.1 per Mac OS. Ho fatto Avanzate ... Ottimizzatore PDF ... Audit utilizzo dello spazio ... . Una piccola finestra di dialogo mostrava il numero di byte dovuti a ciascuna categoria di utilizzo, oltre alla percentuale della dimensione totale del file per la categoria.

L'originale Giulio.pdfha 390.754 byte (84,75%) dedicati ai flussi di contenuto e zero byte dedicati alle immagini. È in formato PDF 1.4. Il file salvato da Preview ha 675.846 byte (93,29%) dedicati ai flussi di contenuto, anche zero byte di immagini ed è in formato PDF 1.3. L'anteprima ha aumentato i flussi di contenuto di 285.092 byte e ciò rappresenta il 73% della differenza di dimensione del file tra i due.

Mi chiedevo se il formato di file PDF 1.3 fosse intrinsecamente meno efficiente per la memorizzazione di questo tipo di file. Ho aperto l'originale Giulio.pdfin Adobe Acrobat Professional 8 e fatto Advanced ... PDF Optimizer ... Rendi compatibile con: Acrobat 3.0 e versioni successive e ho premuto OK. Ho salvato il file risultante con un nuovo nome. Il file risultante è in formato PDF 1.3 ed era 452.356 byte, o più piccolo dell'originale. I flussi di contenuto sono 375.171 byte (82,94%), una proporzione simile, ma inferiore ai flussi di contenuto del file originale.

Sembra quindi che possiamo concludere che l'app Anteprima su Mac OS X 10.5.8 non è efficiente come alcuni altri creatori di PDF nel creare flussi di contenuti concisi in file PDF e la differenza è sufficiente per tenere conto di tre quarti della differenza di dimensioni in un file PDF senza immagini.

Ho fatto un esperimento simile su form k.pdfun documento di 1 pagina scansionato dalla carta. Il file originale è 303.730 byte, di cui 298.197 byte (98,18%) sono immagini. Una copia di questo file creato da Anteprima utilizzando Salva con nome ... è di 300.601 byte, o più piccola dell'1%. Questa differenza di dimensione del file è più che spiegata da una categoria di byte "documento overhead" più piccola nel file creato da Preview.

Quindi sembra che possiamo anche concludere che l'anteprima non fa sempre aumentare le dimensioni di un file PDF. Dipende dalla natura del file PDF originale e dalla sua concisione.


3

So che è abbastanza tardi, ma ho trovato qualcosa che sembra funzionare, almeno se usato inizialmente: ho provato a usare il filtro Quartz per "Ridurre le dimensioni del file". Sembra funzionare ma non è attivo per impostazione predefinita. Posso sceglierlo specificatamente tramite il menu Salva con nome (tieni premuto Opzione), ma sono preoccupato che sia impostato automaticamente sul solito metodo di salvataggio automatico.

Ecco cosa sta succedendo per me e come sono arrivato a questa pagina in primo luogo: il PDF inizia come un libro di 900 pagine da 91 MB. Aggiungo una singola annotazione e la salvo e il file salta fino a 2,29 GB. Per finire, ci vuole un'eternità per salvare, soprattutto perché sto salvando su un disco esterno. Per fortuna l'azionamento è USB 3!

Esiste un modo per estrarre queste annotazioni? Posso annotare ed evidenziare su Goodreader e PDF Expert sul mio iPad. Se l'anteprima non mi consente di farlo sul mio computer, c'è qualche altra app che lo farà? Perché non può semplicemente salvare le annotazioni / i punti salienti ma non provare a ricomprimere tutte le immagini come se stessi salvando un JPEG ogni volta. Grazie per l'aiuto!


Funziona: 400 KiB> 1,3 MiB> 540 KiB. Il mio PDF originale era sotto i 400 KiB e divenne un mostruoso 1.3 MiB dopo aver aggiunto un paio di punti salienti / sottolineature. Ho fatto come suggerito e il file è sceso a 540 KiB: Salva con nome ... con Filtro quarzo impostato su Riduci dimensioni file . Posso ancora modificare i punti salienti precedenti (che diventa impossibile con Esporta come PDF ... ) e le dimensioni sono più in linea con ciò che ottengo modificandolo su un dispositivo diverso.
Daniel,

1

Il problema rimane grave. Nell'anteprima 7.0 (Mac Os 10.9.5.) Ho generato un pdf usando Acrobat 9.5.5. che ha provocato un file di 5 MB. Nell'anteprima ho aggiunto esattamente 12 caratteri (usando gli strumenti di modifica). Dopo aver salvato questo file è balooned a 14 MB.

Puoi risolverlo aprendo e salvando di nuovo in Acrobat (potrebbe essere necessario utilizzare l'opzione "Riduci dimensioni file").


2
Questo non spiega perché ciò accada, ed è ciò che la domanda sta ponendo.
Ian C.

0

Impossibile aggiungere indizi alla soluzione. Posso aggiungere uno scenario simile (OS X 10.11.3): un pdf scansionato di ~ 800kb viene aperto in anteprima, vengono eliminati un paio di paging scansionati vuoti, il pdf più corto risultante di due pagine è ~ 2,2Mb. "Opzione-Salva con nome" e selezionando il filtro al quarzo "Riduci dimensioni file" comprime il file fino a ... 1,9Mb.

Il file originale è stato generato da una copiatrice Xerox WC 7830, che nella mia esperienza (rispetto alle precedenti macchine multifunzione per fotocopie / stampanti) produce PDF scansionati abbastanza ottimizzati.

Non riesco a vedere alcuna differenza nel file, visivamente; Mi piacerebbe indovinare pagina le immagini vengono ricompresso in 24bpp, mentre il file originale è cleary utilizzando molto meno profondità di colore, probabilmente a 6 bit (è una stampata e documento firmato, solo testo, lo scanner fa un buon lavoro di tenere il sfondo bianco bianco puro). Purtroppo, l'anteprima non è abbastanza intelligente da rilevare e mantenere questo, e sembra che sia necessario ricomprimere l'intero file anche se non vengono apportate modifiche nelle pagine rimanenti (di nuovo, solo un paio di pagine sono state eliminate.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.