Esiste un software (o pseudo-codice) in grado di scansionare automaticamente un pezzo di testo (incollato nello strumento o leggere da un .doc / .pdf) e identificare i dati di citazione usando formati standard? I dati verrebbero quindi suddivisi nei suoi campi costitutivi ed esportati in XML, CSV o altri formati di dati strutturati. Ho esaminato cb2Bib ma è stato in grado di estrarre l'anno solo da riferimenti in stile Harvard, il che è insufficiente.