Sto lavorando a un progetto che chiede agli altri studenti di condividere i loro dati di testo originali per ulteriori analisi usando tecniche di data mining e, penso che sarebbe opportuno anonimizzare i nomi degli studenti con le loro osservazioni.
Mettendo da parte le migliori soluzioni di un url in cui gli studenti inviano il loro lavoro e uno script di backend inserisce l'ID anonimo, che tipo di soluzioni potrei dire agli studenti di implementare da soli per rendere anonimi i loro nomi?
Sono ancora un noob in questa zona. Non so quali siano le norme. Pensavo che la soluzione potesse essere un algoritmo di hashing. Sembra una soluzione migliore rispetto alla creazione di un nome falso poiché due persone potrebbero scegliere lo stesso nome falso. Le persone possibili potrebbero scegliere lo stesso nome falso. Quali sono alcune delle preoccupazioni di cui dovrei essere a conoscenza?