Qualità del geocodice: Nominatim vs PostGIS Geocoder vs. Geocoder :: US 2.0


14

Occasionalmente ho bisogno di geocodificare >> 500.000 indirizzi americani (nessuna caratteristica o incrocio). Vorrei impostare un servizio di geocodifica localmente per gestire questi geocodici di massa.

In passato ho usato localmente il geocoder :: US 2.0 basato su Tiger . Il benchmarking iniziale fornisce una ragionevole accuratezza rispetto agli indirizzi geocodificati di Google, specialmente quando non mi affido al parser Ruby e passo esplicitamente gli elementi dell'indirizzo al geocoder.

Ho anche letto molto sul geocoder PostGIS . Dato che i miei dati sono già in PostGIS, sembra interessante, ma non li ho impostati localmente per provarli.

Inoltre, qualcuno mi ha consigliato di provare Nominatim localmente. Non ne so molto, tranne per il fatto che non è basato su Tiger (per quanto posso dire), e mi chiedo se otterrò risultati più affidabili.

La mia domanda a chiunque abbia esperienza con le soluzioni di cui sopra: come si confronta l'accuratezza delle tre? In particolare, quale fornisce i geocodici più affidabili per gli indirizzi statunitensi? Non mi preoccupo eccessivamente della velocità o della complessità della configurazione.

Risposte:


14

Non ho avuto la possibilità di testare i geocoder americani Nominatim e Geocoder. La mia comprensione, tuttavia, è che Geocoder e Nominatim non possono essere eseguiti direttamente nel database, il che per me rappresenta un grosso svantaggio perché li rende difficili da usare in cose come trigger o per aggiornamenti batch direttamente nel database.

Il geocoder PostGIS essendo un puro insieme PostGIS / postgresql di funzioni plpgsql, viene eseguito completamente nel database. Mi aspetto che i risultati del geocoder Geocoder US e PostGIS siano alla pari e da quello che ho testato usando il Web. Google è un po 'meglio poiché sfruttano i nomi dei luoghi.

Penso che Nominatum dal momento che utilizza i dati OSM utilizza indirettamente i dati della tigre poiché OSM importa per gli Stati Uniti gran parte di ciò proviene da TIGER con correzioni apportate dall'utente. Non sono sicuro di quale annata (anno) di Tiger OSM sia attualmente attiva. Dal giocare con le interfacce Web online, sfrutta anche i nomi dei luoghi e ha una svolta interessante in quanto consente di specificare il livello di zoom del geocodifica che consente una geocodifica più veloce impostando la precisione di zoom necessaria.

Divulgazione completa - Ho lavorato molto su Geocoder PostGIS e ho scritto il manuale online per questo. Ti dirò che un bug su cui sto lavorando è che penso che la posizione del punto che interpola sia dalla parte sbagliata della strada. Sto lavorando per risolverlo. Se ti potrebbe interessare di meno da quale parte della strada (o almeno a volte), allora potrebbe non essere un problema per te.

Probabilmente vale la pena testare con le versioni online confrontando alcuni risultati dell'indirizzo: ad esempio nominatim è possibile testare qui: http://open.mapquestapi.com/nominatim/v1/search.php

Per i miei casi d'uso ho scoperto che il controllo fuzzy del nominatum non è buono come quello che ha Geocoder PostGIS. Ad esempio il mio indirizzo di vanità (indirizzo postale) è 1 Devonshire Place, Boston MA. PostGIS restituisce una risposta simile a quella che ricordo, Google restituisce una risposta, ma non riesco a ottenere una risposta da Nominatim. Ad essere onesti anche i registri dei pacchi di Boston non hanno idea di dove sia e vengono elencati nei registri dei pacchi come Washington Street. PostGIS può trovarlo poiché esegue vari livelli di controllo e incroci di strade trasversali, ecc. Ho testato altri casi in cui ho digitato intenzionalmente la zip errata o qualcosa del genere e PostGIS è tornato con una serie accurata di opzioni. Anche Google lo fa.


Commento aggiuntivo: probabilmente vale la pena testarlo con le versioni online confrontando alcuni risultati dell'indirizzo: ad es. Nominatim è possibile testare qui: open.mapquestapi.com/nominatim/v1/search.php
LR1234567

Grazie per la risposta! Farò un po 'di benchmarking circa la prossima settimana o giù di lì, ma finora sono rimasto impressionato dal programmatore Tiger PostGIS.
danpelota,

Escludendo il blocco occasionale per un principiante, ovviamente: postgis.refractions.net/pipermail/postgis-users/2011-March/…
danpelota

tigergeocoder.com utilizzando i dati TIGER 2013, pronti per eseguire la propria istanza del server nel cloud Amazon EC2 e geocodice 1.000.000+ al giorno. PostGIS, come hai detto, ha caricato anche i Quartieri Zillow e restituisce i codici FIPS per le parti dell'indirizzo. API REST simile a Google ma con il tuo server, nessuna quota necessaria.
Biba,

Nominatim corre veloce e tende ad essere più preciso nel 2019, dati pre-nuovi sulla tigre. Non stima le aree e l'indirizzo indovinare è semplicemente migliore.
Andrew Scott Evans,

-1

Tecnicamente puoi impilare i database Tiger e OSM in un unico server gigante e crearli all'interno di Nominatum OSM. Tiger può essere importato facilmente e integra il server OSM.

Chiunque, la qualità dei dati che recupererai non sarà sul tetto. L'OSM non ha precisione per gli indirizzi negli Stati Uniti. In alcune occasioni l'ho visto fino a 90 miglia dall'obiettivo originale.

Inoltre, il database Tiger non è accurato a causa dell'algoritmo di interpolazione assegnato ad esso per prevedere le posizioni dei numeri civici. In generale compenseranno l'obiettivo reale da 300 piedi a un paio di miglia.

Penso che sia necessario valutare il tempo e le risorse di hosting se si costruisce il proprio geocoder rispetto a uno commerciale. Con quello commerciale otterrai posizioni sul tetto e non preoccuparti di nulla. I prezzi per 500.000 saranno compresi tra $ 600 e $ 800 con diversi fornitori.


2
Cosa ha a che fare la tua risposta con la tua azienda? Sembra che tu stia includendo una firma con un link al tuo sito web sotto forma di, in questo caso, un disclaimer non necessario, e quindi lo sto modificando. In ogni caso, non includere un collegamento in alcuna dichiarazione di non responsabilità.
PolyGeo
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.