Modi per gestire la funzionalità longitudine / latitudine [chiuso]


18

Sto lavorando a un set di dati di fantasia con 25 funzionalità. Due delle caratteristiche sono la latitudine e la longitudine di un luogo e altre sono valori di pH, elevazione, velocità del vento, ecc. Con intervalli variabili. Posso eseguire la normalizzazione sulle altre funzioni ma come posso accedere alle funzioni di latitudine / longitudine?

Modifica: questo è un problema per prevedere la resa agricola. Penso che lat / long sia molto importante poiché le posizioni possono essere vitali nella previsione e quindi nel dilemma.


Potresti chiarire perché non pensi di poter normalizzare quelle funzionalità? Presumibilmente sono numerici come le altre caratteristiche, quindi puoi prendere media / sd? Ti preoccupi di avere una misura naturale della distanza tra le posizioni? In tal caso, i dati coprono una piccola area (con valori simili) o sono globali?
Neil Slater

@NeilSlater È intuitivo che per me non ha senso normalizzare queste funzionalità. Le informazioni non andranno perse se normalizzate? Ho il set di dati che copre le contee d'America.
AllThingsScience

Quali informazioni pensi che andranno perse? Probabilmente non andrà perso, ma se nella tua domanda spieghi qual è la tua preoccupazione, qualcuno sarà in grado di rispondere. Non sapendo più, vorrei solo normalizzarmi indipendentemente - per valori completamente globali e alcuni problemi (dove la distanza tra i punti è importante) potrei creare una funzione di coordinate cartesiane 3d dal long / lat.
Neil Slater

Qual è la tua domanda qui? Cosa stai cercando di scoprire dai dati? Correlazione? Clustering? Classificazione? Predizione? Interpolazione? In che modo la posizione è importante per il tuo modello?
Spacedman

@Spacedman Vedi modifica.
AllThingsScience,

Risposte:


24

Le coordinate long lat hanno il problema che sono 2 caratteristiche che rappresentano uno spazio tridimensionale. Ciò significa che la coordinata lunga gira tutto intorno, il che significa che i due valori più estremi sono in realtà molto vicini tra loro. Ho affrontato questo problema alcune volte e quello che faccio in questo caso è mapparle su coordinate x, ye z. Ciò significa che i punti vicini in queste 3 dimensioni sono anche vicini nella realtà. A seconda del caso d'uso è possibile ignorare le variazioni di altezza e mapparle su una sfera perfetta. Queste funzionalità possono quindi essere standardizzate correttamente.

Per chiarire (riassunto dai commenti):

x = cos(lat) * cos(lon)
y = cos(lat) * sin(lon), 
z = sin(lat) 

1
È molto interessante. Grazie! Potresti confermare se queste sono le formule per la conversione? x = R * cos (lat) * cos (lon), y = R * cos (lat) * sin (lon), z = R * sin (lat)
AllThingsScience

Non ho accesso al mio codice al momento, ma sembra giusto. Non hai bisogno della R poiché ti uniformerai comunque;)
Jan van der Vegt

Perfetto! Grazie.
AllThingsScience
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.