Sto cercando di trovare testo in Word 2010 nel seguente formato: ABC.DEF.XYZ. Questo è essenzialmente trovare riferimenti a codice, usando la sintassi Java, scritti nel documento word. Si noti che un riferimento a 3 elementi è solo un esempio. I riferimenti effettivi hanno un minimo di 2 elementi e fino a 5 elementi.
Ho provato numerose combinazioni di caratteri jolly (e non jolly) per farlo funzionare, ma non ho avuto fortuna. Ecco alcune delle cose che ho provato:
<([a-z0-9A-Z]@)>.<([a-z0-9A-Z]@)>
NOTA, questo funziona effettivamente per trovare un riferimento a 2 elementi. È stato un colpo mancante quando è stato trovato il modello all'interno di una stringa più grande (ad es. Corrispondenza degli elementi 2 e 3 di un riferimento a 3 elementi)<([a-z0-9A-Z]@)>(.<([a-z0-9A-Z]@)>)@
Fornisce un errore - modello non valido<([a-z0-9A-Z]@)>.<([a-z0-9A-Z]@)>.<([a-z0-9A-Z]@)>
Richiede così tanto tempo che Word si blocca per oltre 15 minuti e non trova una singola corrispondenza (il documento contiene circa 150 pagine di testo, quindi forse era troppo per essere gestito)<([a-z0-9A-Z]@)>.<([a-z0-9A-Z]@)>.<([a-z0-9A-Z]@)>.<([a-z0-9A-Z]@)>
Word si è effettivamente bloccato quando ho provato questo.
Idealmente, penso che una versione funzionante di # 2 sarebbe l'ideale - tuttavia, non so come rendere valido il modello.
Se ciò non fosse possibile, potrei semplicemente usare il n. 1 e sperare che riesca a catturare tutto (non sono sicuro del perché corrisponda a determinate stringhe e non ad altre).
Qualsiasi aiuto è molto apprezzato.