Sto facendo un lavoro di traduzione che mi ha richiesto di spezzare lunghe pagine o paragrafi al limite della frase, ovvero un punto fermo (.) Per l'inglese e Poorn-Viraam (।) per l'hindi.
Si chiama "allinea" o (probabilmente) tokenizzazione.
Per Notepad ++ (w9-32 bit), c'è qualche componente aggiuntivo o regex o macro per dividere il testo lungo in frasi. (in file txt di testo normale).,
In regex, non riesco proprio a trovare. e sostituirlo con. \ r \ n perché. è anche usato come indicazione di abbreviazione, per esempio in pvt. Inoltre, se ci sono diverse frasi tra parentesi () [] {}, anche queste non dovrebbero essere spezzate.
Quindi, immagino che un singolo comando regex non funzioni, o diventerà troppo complesso per prendersi cura di tutte le possibilità.
deve essere un insieme di regex eseguito uno dopo l'altro, o una macro,
o se qualcuno ha sviluppato un componente aggiuntivo per questo?
Grazie.
Rawat
i.e.
è una scorciatoia, come farebbe a sapere che non è la fine della frase? Potresti essere in grado di scrivere una regex che ignora i segni se la parola prima ha una lunghezza di carattere "comune" (3?) Per un'abbreviazione. Non sarà perfetto ma potrebbe aiutarti?