Algoritmi di apprendimento automatico per la classificazione della copertura del suolo


37

Sono interessato a sapere quale software esiste per la classificazione del territorio utilizzando algoritmi di apprendimento automatico (ad esempio k-NN, Random Forest, alberi decisionali, ecc.) Sono a conoscenza del pacchetto randomForest in R e MILK e SPy in Python.

Quali algoritmi di apprendimento automatico open source o commerciali sono adatti per la classificazione della copertura del suolo?

Risposte:


34

Devo dire che l'ambiente software più completo per l'apprendimento automatico e la modellazione non parametrica è R. Questo è un grande campo in statistica, che comprende K-NN, smoothing del kernel, modelli di additivi generali, studenti deboli, vettori di supporto, reti neurali, semi regressione spline parametrica, imputazione, ecc ... Consiglio vivamente di leggere: Hastie, T., R. Tibshirani, J. Friedman (2009) The Elements of Statistical Learning: Data Mining, Inference and Prediction. Serie Springer in Statistica.

Oltre a R, il software commerciale di Salford Systems ha foreste casuali, spline di regressione adattiva multivariata, CART e Gradient Boosting (TreeNet) disponibili in un ambiente GUI. RuleQuest sta ancora vendendo See5 / C5 che è una versione aggiornata dell'algoritmo CART C4 / ID3. Weka 3 dell'Università di Waikato è una GUI open source / sforzo Commandline Java con un gran numero di modelli disponibili.


1
@Aaron FYI, io e Falk Hutterman stiamo tenendo un seminario al meeting US-IALE (Landscape Ecology) 2013 ad Austin, TX. Il nostro focus sarà sull'uso di R per l'apprendimento automatico e la modellazione non parametrica. Fornirò anche un'introduzione all'uso degli oggetti spaziali in R per la preparazione dei dati e la specifica dei modelli.
Jeffrey Evans,

23

Consiglio vivamente scikits-learn per Python. Supporta la classificazione supervisionata e senza supervisione e la documentazione è eccellente (in particolare controlla il tutorial di Machine Learning for Astronomical Data Analysis e il video di YouTube che accompagna (nota: questa durata è di 3 ore)).

Il progetto è in fase di sviluppo attivo, con l'ultima versione 0.12 rilasciata a settembre.

Per quanto riguarda ciò di cui il pacchetto è in grado, vedere Vicini più vicini , Foresta casuale (sotto Metodi Ensembe) e Alberi decisionali per usare gli esempi forniti .

Sfortunatamente nessuna GUI a meno che tu non voglia dedicare tempo alla costruzione di uno, ma raccomanderei l' IPython IDE come un eccellente ambiente di script interattivo, compresi i grafici in linea con matplotlib nella console QT.



6

La tua domanda presume che gli algoritmi di apprendimento automatico per la classificazione dei terreni siano in qualche modo distinti dal software utilizzato per altre applicazioni di apprendimento automatico. Ci sono alcune applicazioni che richiedono un trattamento speciale a causa di caratteristiche insolite, ma non ho motivo di sapere che l'uso del suolo richiede un trattamento speciale. Se i dati sull'uso del suolo possono essere messi in una forma delimitata da virgole standard, gli strumenti esistenti come R dovrebbero andare bene. Ora potrebbe esserci o meno un software Land Use che utilizza modelli scoperti dalle tecniche di apprendimento automatico, ma questa è una domanda diversa.

Modificato dopo la prima risposta. -> La maggior parte dei principali pacchetti per l'apprendimento automatico ha alcuni strumenti per la visualizzazione spaziale, anche se ovviamente potrebbero non soddisfare le tue esigenze particolari. Ad esempio, hai familiarità con la libreria sp per R che è destinata alla visualizzazione di dati spaziali? Vediamo se riesco a trovare un link appropriato che dia il sapore di ciò che puoi farci.

http://rwiki.sciviews.org/doku.php?id=tips:spatial-data:spatial_data_visualization Per un elenco più ampio di strumenti utili per l'analisi spaziale in R, potresti dare un'occhiata a http: //cran.r- project.org/web/views/Spatial.html poiché include strumenti per la geostatistica, l'analisi ecologica e simili.


5

Hai dato un'occhiata a eCognition? Con la loro nuova versione (8.9) forniscono l'algoritmo Random Forests all'interno di un ambiente GUI. È possibile creare simpatici alberi di processo e includere funzionalità degli oggetti. inserisci qui la descrizione dell'immagine


4

C'è un gruppo della Duke University che ha sviluppato alcuni interessanti strumenti di script per ArcGIS, inclusi modelli forestali casuali.

Strumenti di ecologia geospaziale marina

inserisci qui la descrizione dell'immagine


2
La toolbox MGET è solo un wrapper per R. Se hai la capacità di usare R puoi evitare un considerevole mal di testa chiamando R tramite ArcGIS, tramite Python (Rpy2). Inoltre, non si ha flessibilità nell'uso di altri strumenti in R che possono essere applicati agli oggetti dei modelli RF, GAM, regressione o CART risultanti.
Jeffrey Evans,

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.