Stiamo creando un sito Web che raccoglierà informazioni sulla posizione (punti) dagli utenti. Stiamo esplorando tecniche per preservare la privacy della posizione degli utenti (ad esempio, spesso gli utenti condivideranno il loro indirizzo di casa, che è sensibile). Un'opzione che mi è venuta in mente è quella di offuscare o "hash" i punti prima di archiviarli nel database, eliminando la necessità di archiviare affatto questi dati sensibili.
I nostri requisiti di base sono, credo:
Dato un singolo punto offuscato, non è possibile derivare il punto originale entro (diciamo) un chilometro o giù di lì, anche dati tutti i metadati associati al punto (cioè, supponiamo che l'intero database sia compromesso).
Dato un insieme arbitrariamente ampio di punti offuscati corrispondenti allo stesso punto originale, non è ancora possibile derivare il punto originale. (Ad esempio, una tecnica semplice sarebbe quella di aggiungere un vettore casuale al punto originale, ma se lo fai abbastanza volte, i punti offuscati si raggrupperanno attorno al punto originale.)
Sarebbe bello se fossero conservate varie proprietà statistiche, anche se non so quali siano le proprietà importanti in questa fase. Ad esempio, preferirei che i punti offuscati si disperdano in modo "naturale" piuttosto che accumularsi in una griglia. Tuttavia, la privacy è più importante di così.