Ho fatto una domanda simile chiedendo la distanza tra i "documenti" (articoli di Wikipedia, notizie, ecc.). Ho reso questa una domanda separata perché le query di ricerca sono notevolmente più piccole dei documenti e sono notevolmente più rumorose. Quindi non so (e dubito) se le stesse metriche di distanza sarebbero utilizzate qui.
Sono preferite le metriche della distanza lessicale vaniglia o le metriche della distanza semantica all'avanguardia, con una preferenza maggiore per quest'ultima.