Sia sia una funzione che chiamiamo funzione di somiglianza . Esempi di funzione di somiglianza sono distanza coseno, l 2 norma, distanza di Hamming, Jaccard similitudine, etc.
Considera vettori binari di lunghezza : .
Il nostro obiettivo è raggruppare vettori simili. Più formalmente, vogliamo calcolare un grafico di somiglianza in cui i nodi sono i vettori e gli spigoli rappresentano i vettori che sono simili ( ).
e sono numeri molto grandi e confrontando duevettori dilunghezza è costoso, non possiamo eseguire tutte le operazioni a forza bruta. Vogliamo calcolare il grafico di somiglianza con un numero significativamente inferiore di operazioni.
È possibile? In caso contrario, possiamo calcolare un'approssimazione al grafico che contiene tutti i bordi nel grafico di somiglianza più eventualmente al massimo altri bordi?