Nel 1999, Beyer et al. chiesto, quando è significativo il "prossimo più vicino"?
Esistono modi migliori per analizzare e visualizzare l'effetto della planarità della distanza sulla ricerca NN dal 1999?
[Un dato] set di dati fornisce risposte significative al problema 1-NN? Il problema di 10-NN? Il problema 100-NN?
In che modo gli esperti affronterebbero oggi questa domanda?
Modifiche lunedì 24 gennaio:
Che ne dici di "distanza distanza" come nome più breve di "distanza piatta con dimensione crescente"?
Un modo semplice per vedere il "whiteout della distanza" è correre 2-NN e tracciare le distanze dal vicino più vicino e dal secondo vicino più vicino. La trama seguente mostra dist 1 e dist 2 per una gamma di ncluster e dimensioni, di Monte Carlo. Questo esempio mostra un contrasto di distanza piuttosto buono per la differenza assoluta in scala | dist 2 - dist 1 |. (Le differenze relative | dist 2 / dist 1 | → 1 come dimensione → ∞, quindi diventano inutili.)
Se errori assoluti o errori relativi debbano essere utilizzati in un dato contesto dipende ovviamente dal rumore "reale" presente: difficile.
Suggerimento: eseguire sempre 2-NN; 2 vicini sono utili quando sono vicini e utili quando no.