Dato un enorme database di parole consentite (in ordine alfabetico) e una parola, trova la parola dal database più vicina alla parola data in termini di distanza di Levenshtein.
L'approccio ingenuo è, ovviamente, semplicemente calcolare la distanza di levenshtein tra la parola data e tutte le parole del dizionario (possiamo fare una ricerca binaria nel database prima di calcolare effettivamente le distanze).
Mi chiedo se esiste una soluzione più efficiente a questo problema. Forse un po 'euristico che ci consente di ridurre il numero di parole da cercare, o ottimizzazioni dell'algoritmo di distanza Levenshtein.
Collegamenti a documenti sull'argomento benvenuto.