Quali sono i metodi utilizzati dai servizi GeoIP oltre alle informazioni WHOIS? [chiuso]


11

Mi stavo solo chiedendo come i servizi GeoIP raccolgano dati sulla posizione geografica degli IP oltre a controllare l'indirizzo IP delle informazioni WHOIS. Ad esempio, mi sono imbattuto in questo sito Web, che dice che IP 74.207.244.221 si trova a Fremont, in California: https://ipinfo.io/74.207.244.221

Ma non riesco a trovare queste informazioni su queste informazioni whois IP. ipinfo.io afferma che:

Inizialmente la nostra API utilizzava i dati MaxMind, ma siamo stati molto impegnati a creare i nostri dati di geolocalizzazione. Abbiamo compiuto molti progressi e ora utilizziamo i nostri dati per soddisfare circa la metà di tutte le richieste. Tuttavia, eseguiamo il fallback dei dati di MaxMind

E questo mi ha interessato, quali sono i modi in cui servizi come ipinfo.io e MaxMind raccolgono dati GeoIP?

Risposte:


11

Tali servizi di solito utilizzano 3 modi per geolocalizzare un indirizzo IP:

  1. Passando attraverso i database whois per cercare un indirizzo;
  2. Tracciamento di query DNS inverse per cercare di trovare indizi basati su record di nomi di dominio o tracciare il percorso del pacchetto inviato alla destinazione, che potrebbe anche fornire indizi (usando traceroute, ad esempio).
  3. E infine, usano la triangolazione RTT.

La triangolazione Round-Trip Time (RTT) è un metodo utilizzato per ottenere la geolocalizzazione approssimativa di un indirizzo IP misurando la latenza del ping da tre diverse posizioni.

Ad esempio, se hai tre server sparsi in tutto il mondo a forma di triangolo e se esegui il ping di un indirizzo IP da tutti e tre e ottieni gli stessi risultati per la latenza, ciò significherebbe che l'indirizzo IP si trova proprio in il centro di quel triangolo. È il modo in cui funziona la triangolazione, tuttavia, in questo caso viene utilizzato con ping ICMP.

Risorse che puoi leggere: che
cos'è il ping? @ Wikipedia
SIGCOMM paper sulla triangolazione RTT


5
Wow, non avrei mai pensato che ci fosse una triangolazione basata su RTT. Interessante. Quindi, se alcuni server vorrebbero evitare di essere geolocalizzati, potrebbero introdurre ritardi casuali nelle risposte dell'ICMP.
Studente

Vorrei aggiungere che potrebbe essere utile guardare tracert / traceroute, come scritto su iplocation.net: "Puoi usare il comando 'traceroute' per trovare indizi sulla posizione dell'indirizzo IP. I nomi dei router attraverso i quali i pacchetti che fluiscono dal tuo host all'host di destinazione potrebbero suggerire il percorso geografico della posizione finale. "
Studente

1
@Learner è una bella aggiunta, tuttavia, che è già nella mia risposta sotto forma di "monitoraggio delle query DNS inverse". Sebbene traceroute non lo faccia davvero, ti mostra tutti i domini / indirizzi attraverso i quali viaggia una query. Aggiungerò una nota per renderlo ancora più chiaro :)
Fanatique,

5

Sono il fondatore di IPinfo , quindi posso sicuramente offrire alcuni dettagli in merito! Non esiste un solo metodo che utilizziamo o un'unica fonte di dati per produrre il nostro database di geolocalizzazione (o uno qualsiasi dei nostri altri set di dati, come IP per azienda o IP per operatore). È un mix di diversi set di dati, tecniche di elaborazione dei dati e lezioni apprese facendo questo da diversi anni!

Alcune fonti di dati e tecniche non menzionate spesso includono:

  • Feed diretti dagli ISP. Il nostro servizio gestisce circa 500 milioni di richieste API al giorno e viene utilizzato su molti popolari siti Web di alto profilo. Pertanto gli ISP sono incentivati ​​a fornirci dati di geolocalizzazione accurati e aggiornati in modo che i loro clienti possano vivere una grande esperienza sul web. Lavoriamo direttamente con sempre più ISP per tutto il tempo.

  • Dati sulla posizione GPS. È possibile raccogliere informazioni precise sulla posizione con il GPS su dispositivi mobili. È possibile accoppiarlo con l'indirizzo IP e l'inferenza di una topologia di rete per determinare la posizione per gli intervalli IP dati solo alcune misurazioni.

  • Le correzioni inviate dall'utente. Quando la posizione è errata (o non è stata aggiornata dopo una modifica) spesso riceviamo rapidamente feedback dagli utenti e possiamo correggere manualmente la posizione o modificare il nostro algoritmo per assicurarci che sia correttamente posizionato alla prossima esecuzione di la nostra pipeline di elaborazione dati.

Per il nostro set di dati IP / azienda, in realtà raschiamo ogni singolo nome di dominio ogni mese e facciamo un riferimento incrociato ai dati che estraiamo lì con informazioni sulla proprietà IP, record rwhois e altro. Quindi utilizziamo anche i dati di scraping del dominio per mostrare quali domini sono ospitati su quali indirizzi IP e anche nel nostro classificatore di tipi IP, insieme a molte altre fonti di dati, per determinare la probabilità che un indirizzo IP venga utilizzato principalmente come ISP residenziale, azienda o fornitore di hosting. Abbiamo anche analizzare la struttura dei link di quelle pagine, e mostrare alcuni di questi dati su host.io .


Grazie! Non mi aspettavo che il fondatore di questo sito Web rispondesse alla mia domanda :) È stato molto interessante.
Studente il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.