Foreste casuali per regressione multivariata


23

Ho un problema di regressione multi-output con input e output . Gli output hanno una struttura di correlazione complessa, non lineare.dXdy

Vorrei usare foreste casuali per fare la regressione. Per quanto ne so, le foreste casuali per la regressione funzionano solo con un singolo output, quindi dovrei addestrare foreste casuali - una per ogni output. Questo ignora le loro correlazioni.dy

Esiste un'estensione alle foreste casuali che tiene conto delle correlazioni di output? Forse qualcosa come la regressione del processo gaussiano per l'apprendimento multi-task .


4
ecco cosa sono stato in grado di scavare finora: scikit-learn.org/dev/modules/tree.html#multi-output-problems
sergeyf

1
sicuro. ho "immagini" ad alta dimensione (in realtà spettri dI / dV) di peptidi. l'obiettivo è capire le posizioni e le classi degli aminoacidi che compongono il peptide. il mio primo approccio era la segmentazione delle immagini, ma i CRF e le foreste casuali pixel-saggio fallirono. così ora, invece di dire che ogni pixel "appartiene" a un solo aminoacido (non proprio vero), sto assegnando a ciascun pixel un valore relativo di "influenza" dagli amminoacidi vicini. Ciò comporta un istogramma tridimensionale per ciascun pixel. quindi, regressione multipla dell'output! dy
sergeyf,

1
Potrebbe essere una risposta tardiva: in Crimisini et al. Foreste decisionali: un quadro unificato per la classificazione, la regressione, la stima della densità, l'apprendimento collettivo che usano la RF in un modo che potrebbe adattarsi all'identificazione dei confini degli organi.
Simone

4
Anche questo potrebbe essere in ritardo, ma potrebbe aiutare chiunque inciampare in questo post. La foresta casuale può essere facilmente addestrata utilizzando dati multivariati. Tutto accade allo stesso modo, tuttavia invece di utilizzare la varianza per il calcolo del guadagno di informazioni, utilizziamo la covarianza delle variabili di output multiple. E, soprattutto, le foglie ora contengono PDF N-dimensionali.
Masad,

1
Non so che la RF "Questo ignora le loro correlazioni". Data la natura d'insieme della RF, penso che potrebbero spiegare le correlazioni. Se avessero ricevuto input univariati e avessero prodotto output univariati, non avrebbero tenuto conto delle correlazioni.
EngrStudent - Ripristina Monica

Risposte:



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.