Sto usando tre-agrep
(manpage) , un'implementazione di agrep
(manpage) , per eseguire una corrispondenza approssimativa del modello. Questa utility cerca corrispondenze in base alla distanza di Levenshtein e l'utente può configurare la penalità applicata per le modifiche di sostituzione, inserimento o cancellazione.
Vorrei, tuttavia, applicare pesi in modo diverso su tutta la lunghezza della query, in particolare con un peso inferiore per le eliminazioni all'inizio (estremità sinistra) della query rispetto a destra. La man
pagina per questa utility non indica che un tale livello di controllo è possibile.
Esistono altri strumenti da riga di comando in cui è possibile una corrispondenza approssimativa con un controllo più preciso delle penalità di mancata corrispondenza?
agrep
cui hanno effettivamente bisogno, probabilmente potrei creare qualcosa. Calcolare la distanza di Levenshtein di due stringhe è molto semplice, davvero. Suggerirei uno script shell avvolto attorno all'invocazione di GNU awk.