Sto usando tre-agrep (manpage) , un'implementazione di agrep (manpage) , per eseguire una corrispondenza approssimativa del modello. Questa utility cerca corrispondenze in base alla distanza di Levenshtein e l'utente può configurare la penalità applicata per le modifiche di sostituzione, inserimento o cancellazione.
Vorrei, tuttavia, applicare pesi in modo diverso su tutta la lunghezza della query, in particolare con un peso inferiore per le eliminazioni all'inizio (estremità sinistra) della query rispetto a destra. La manpagina per questa utility non indica che un tale livello di controllo è possibile.
Esistono altri strumenti da riga di comando in cui è possibile una corrispondenza approssimativa con un controllo più preciso delle penalità di mancata corrispondenza?
agrepcui hanno effettivamente bisogno, probabilmente potrei creare qualcosa. Calcolare la distanza di Levenshtein di due stringhe è molto semplice, davvero. Suggerirei uno script shell avvolto attorno all'invocazione di GNU awk.