Identificazione
Ho trovato questo strumento che sembra essere quello che puoi usare per identificare i file PDF / A. Si chiama DROID (Digital Record and Object Identification) . È basato su Java e può essere eseguito da una GUI o dalla riga di comando.
estratto
DROID è uno strumento software sviluppato da The National Archives per eseguire l'identificazione batch automatizzata dei formati di file. Sviluppato dal suo dipartimento di conservazione digitale come parte delle sue più ampie attività di conservazione digitale, DROID è progettato per soddisfare i requisiti fondamentali di qualsiasi archivio digitale per essere in grado di identificare il formato preciso di tutti gli oggetti digitali archiviati e collegare tale identificazione a un registro centrale di informazioni tecniche su quel formato e le sue dipendenze.
Dato che è sponsorizzato dall'Archivio Nazionale, suppongo che sia lo strumento giusto per farlo, dato lo scopo previsto del formato PDF / A. Anche il progetto è open source e il codice è disponibile su Github e confezionato in forma binaria dal sito web degli Archivi nazionali .
Convalida e conversione
Se stai cercando uno strumento per eseguire la convalida e la conversione, credo che PDFBox possa farlo. PDFBox elenca la convalida PDF / A direttamente sulla prima pagina del loro sito Web. È un'altra applicazione Java Cool.
estratto dal sito web
Convalida PDF / A
Convalida PDF in base allo standard PDF / A ISO.
Nella sezione degli strumenti da riga di comando a sinistra della loro pagina principale viene mostrato il seguente utilizzo per lo strumento:
$ java -jar pdfbox-app-x.y.z.jar org.apache.pdfbox.ConvertColorspace [OPTIONS] <inputfile> <outputfile>
veraPDF è un altro strumento in grado di convalidare PDF / A; fa parte del set di strumenti di riferimento della Open Preservation Foundation. È anche un'applicazione Java.
Conversione
Per fare solo la conversione ho trovato questo metodo da un post sul blog intitolato: Modo gratuito per convertire un PDF esistente in PDF / A , che utilizza i seguenti strumenti:
- Solo Ghostscript 8.64.
- PDFBox 0.7.3
- pdfmarks (file per fornire metadati aggiuntivi)
- PDFA_def.ps
- USWebCoatedSWOP.icc
Con quanto sopra in atto si utilizza il seguente comando:
$ gs -sDEVICE=pdfwrite -q -dNOPAUSE -dBATCH -dNOSAFER \
-dPDFA -dUseCIEColor -sProcessColorModel=DeviceCMYK \
-sOutputFile=Out_PDFA.pdf PDFA_def.ps pdfmarks IN_PDF.pdf
Non è senza le sue verruche. L'articolo ne discute uno, fissando le bandiere di stampa sui collegamenti ipertestuali come uno di essi. L'articolo fornisce un'applicazione Java che è possibile utilizzare per correggere questi:
$ java FixPrintFlag Out_PDFA.pdf New_verifiablePDFA.pdf
Non è carino ma sembra fattibile. Vedi l' articolo per maggiori dettagli.
Riferimenti