Ho un grosso file ordinato con miliardi di righe di lunghezza variabile. Data una nuova riga, vorrei sapere quale numero di byte otterrebbe se fosse stato incluso nel file ordinato.
Esempio
a\n
c\n
d\n
f\n
g\n
Dato l'ingresso 'pippo' otterrei l'output 9.
Questo è facile da fare semplicemente esaminando l'intero file, ma essendo miliardi di righe di lunghezza variabile sarebbe più veloce fare una ricerca binaria.
Esiste già un tale strumento di elaborazione del testo?
Modificare:
Ora funziona: https://gitlab.com/ole.tange/tangetools/blob/master/bsearch/bsearch