Sto lavorando ad alcuni software che dovrebbero determinare le posizioni del mondo reale (ad esempio autovelox) da diversi rapporti basati su GPS . Un utente guiderà quando segnalerà una posizione, quindi i rapporti saranno molto imprecisi. Per risolvere questo problema, devo raggruppare i report sulla stessa posizione e calcolare una media.
La mia domanda è su come raggruppare quei rapporti . Ho letto degli algoritmi di massimizzazione delle aspettative e il clustering di k -medie , ma ho capito che avrei dovuto determinare in anticipo il numero di posizioni reali.
Esistono altri algoritmi che non necessitano del numero esatto di posizioni reali, ma utilizzano invece alcune condizioni del bordo (per una distanza minima)?
Un rapporto contiene longitudine , latitudine e precisione (in metri). Non esiste un nome o altro che possa essere utilizzato per identificare i duplicati.
Un altro ostacolo potrebbe essere che sarà comune, che esiste un solo rapporto per un luogo reale. Ciò rende difficile distinguere i valori erratici dai buoni dati.