Sì, è possibile, possiamo generare regex da esempi (testo -> estrazioni desiderate). Questo è uno strumento online funzionante che fa il lavoro: http://regex.inginf.units.it/
Lo strumento online Regex Generator ++ genera un'espressione regolare dagli esempi forniti utilizzando un algoritmo di ricerca GP. L'algoritmo GP è guidato da un fitness multiobiettivo che porta a prestazioni più elevate e struttura della soluzione più semplice (Razor di Occam). Questo strumento è un'applicazione dimostrativa del Machine Lerning Lab, Università di Trieste (Università degli studi di Trieste). Guarda il video tutorial qui .
Questo è un progetto di ricerca, quindi puoi leggere gli algoritmi utilizzati qui .
Guarda! :-)
Trovare una regex / soluzione significativa dagli esempi è possibile se e solo se gli esempi forniti descrivono bene il problema. Considera questi esempi che descrivono un'attività di estrazione, stiamo cercando codici articolo particolari; gli esempi sono coppie testo / estrazione:
"The product code is 467-345A" -> "467-345A"
"The item 789-345B is broken" -> "789-345B"
Un ragazzo (umano), guardando gli esempi, potrebbe dire: "i codici oggetto sono cose come \ d ++ - 345 [AB]"
Quando il codice dell'articolo è più permissivo ma non abbiamo fornito altri esempi, non abbiamo prove per comprendere bene il problema. Quando si applica la soluzione generata dall'uomo \ d ++ - 345 [AB] al testo seguente, non riesce:
"On the back of the item there is a code: 966-347Z"
Devi fornire altri esempi, al fine di descrivere meglio cosa è una corrispondenza e cosa non è una corrispondenza desiderata: --ie:
"My phone is +39-128-3905 , and the phone product id is 966-347Z" -> "966-347Z"
Il numero di telefono non è un ID prodotto, potrebbe essere una prova importante.