Ho set di dati che contengono, tra le molte funzioni, le coordinate GPS (latitudine e longitudine). Vorrei utilizzare questi set di dati per esplorare problemi quali: (1) il calcolo dell'ETA per guidare tra i punti iniziale e finale; e (2) stimare l'entità del crimine per un punto specifico.
Vorrei usare un modello di regressione lineare. Tuttavia, posso usare queste coordinate GPS direttamente in un modello lineare?
La latitudine e la longitudine non hanno una proprietà ordinale , come ad esempio l'età di una persona. Ad esempio, i due punti (40.805996, -96.681473) e (41.226682, -95.986587) non sembrano avere un ordinamento significativo. Sono solo punti nello spazio. Stavo pensando di sostituirli con codici postali statunitensi categorici e quindi di fare una codifica a caldo , ma questo avrebbe comportato molte variabili.