Buone risorse sugli algoritmi di geocodifica


19

Conosci qualche buona risorsa sugli algoritmi di geocodifica?

Sono particolarmente interessato all'analisi delle query degli indirizzi, inclusa la corrispondenza e la ponderazione di parti della query, la gestione di errori di ortografia e variazioni, nonché ai dettagli sulla memorizzazione dei dati fisici (ad esempio schemi per query dirette su database relazionali, approcci all'indicizzazione dei dati ecc.) .

Ho studiato alcuni documenti sulla geocodifica di ArcGIS 10, ma toccano un po 'i dettagli dell'implementazione effettiva. Potrebbe essere utile anche la documentazione dettagliata di altre implementazioni di produzione di alta qualità. Più tecnico è, meglio è. Anche gli elaborati teorici dell'algoritmo sono fantastici.

Grazie.

Risposte:


14

Dal testo alle coordinate geografiche: lo stato attuale della geocodifica

Daniel W. Goldberg, John P. Wilson e Craig A. Knoblock Abstract: Questo articolo presenta un sondaggio sullo stato dell'arte delle pratiche di geocodifica attraverso una revisione storica interdisciplinare della letteratura esistente. Esploriamo il concetto in evoluzione di geocodifica e le componenti fondamentali del processo. Vengono discusse le fonti frequenti di errore e incertezza, nonché le misure esistenti utilizzate per quantificarle. Viene presentato un esame delle insidie ​​comuni e delle sfide persistenti nel processo di geocodifica e vengono descritti i metodi tradizionali per superarle.

10.1.1.119.714.pdf

PDF (da pagina 34 in poi) http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.119.714&rep=rep1&type=pdf


Credo che tu abbia il link sbagliato, citeseerx.ist.psu.edu/viewdoc/…
Andy W

@thanks 10.1.1.119.714.pdf è quello corretto post aggiornato - una diversa convenzione di denominazione sarebbe stata migliore.
Mapperz

6

Il documento Mapperz collegato è molto buono e contiene molte citazioni che probabilmente saranno di interesse, ma non credo che facciano un ottimo lavoro nel descrivere la corrispondenza delle stringhe e la sua importanza per il processo di geocodifica. Hanno brevemente menzionato Soundex , ma Soundex non è l'unica opzione e nemmeno l'opzione migliore per gli indirizzi IMO. Hanno elencato alcune citazioni pertinenti all'argomento, quindi quei documenti saranno di tuo interesse.

Questa discussione sul sito di scambio di statistiche parla della corrispondenza fuzzy di due serie di stringhe e tutte le stesse tecniche si applicano quando si corrispondono indirizzi. In particolare, penso che usare le distanze di modifica abbia più senso di Soundex, specialmente con i dettagli dell'indirizzo che non hanno un analogo Soundex. Calcolare la distanza di Levenshtein tra due stringhe non è poi così complicato, e ci sono molti esempi che fluttuano su Internet ( eccone uno in Python).

Ho appena trascorso l'ultima ora a cercare di scoprire come ESRI implementa la loro sensibilità ortografica e i loro punteggi dei candidati e delle partite. Non ho trovato altro che descrizioni semplici (le migliori di quelle che ho trovato in questo PDF e nella sezione della guida in linea di 9.3 ). Quindi, se qualcuno può indicarmi una documentazione più dettagliata, sarei grato così come il PO.




Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.