Ci sono articoli o discussioni sull'estrazione di parte del testo che contiene la maggior parte delle informazioni sul documento corrente.
Ad esempio, ho un ampio corpus di documenti dello stesso dominio. Ci sono parti di testo che contengono le informazioni chiave di cui parla un singolo documento. Voglio estrarre alcune di quelle parti e usarle come una sorta di sommario del testo. Esiste una documentazione utile su come ottenere qualcosa del genere.
Sarebbe davvero utile se qualcuno potesse indirizzarmi nella giusta direzione cosa dovrei cercare o leggere per ottenere una visione del lavoro che potrebbe essere già stato fatto in questo campo dell'elaborazione del linguaggio naturale.