Analisi automatica del contenuto software di file pdf [chiuso]


1

Esiste un software open source / commerciale in grado di eseguire analisi automatiche del contenuto (per produrre sommari ambiziosi) in una vasta raccolta di documenti pdf che hanno taggato metadati per una facile classificazione? Qual è la tecnologia utilizzata da Google per analizzare i PDF ospitati sul Web e classificarli?

Risposte:


0

Non sono sicuro di ciò che utilizza Google, ma è possibile leggere e creare documenti PDF sul lato server con un componente software come ABCpdf.NET. Ciò richiede una certa conoscenza della programmazione in ASP o ASP.NET (Active Server Pages) per server Microsoft IIS o PHP per server Web Apache.


Sto cercando qualcosa che esegua il mining di testo intelligente in un vasto database di file pdf .. può essere un'app desktop / script ecc. Google può analizzare molti formati di file diversi e cercare contenuti testuali
iceman
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.