Risorse per l'apprendimento di tecniche multi-target?


11

Sto cercando risorse (libri, appunti di lezione, ecc.) Su tecniche in grado di gestire dati con target multipli (es: tre variabili dipendenti: 2 discrete e 1 continua).

Qualcuno ha risorse / conoscenze su questo? So che è possibile utilizzare le reti neurali per questo.

Risposte:


6

La foresta casuale la gestisce piuttosto bene, vedi Sarebbe possibile / pratica una foresta casuale con più uscite? o la documentazione di scikit learn . Immagino che GBM o qualsiasi metodo basato sugli alberi possano essere adattati in modo simile.

i(piyi)2i(y^iyi)2+(x^ixi)2

Se si dispone di output di tipo misto (classificazione e regressione), la specifica della funzione target richiederà probabilmente di specificare una funzione target che dia più peso ad alcuni target rispetto ad altri: quale ridimensionamento si applica alle risposte continue? Quale perdita si applica alle classificazioni mancanti?

Per quanto riguarda ulteriori letture accademiche,

Wikipedia di SVM Structured Learning

Sfruttando contemporaneamente strutture di output e attività per la regressione di output multipli

Il metodo di selezione del punto di riferimento per la previsione di output multipli (si occupa di variabili dipendenti ad alta dimensione)


1
Data la regressione multi-target intende anche modellare le relazioni tra le Y, non vorresti una funzione di perdita che misura l'adattamento di quella relazione?
Max Ghenis,

3

Questo documento fa un buon lavoro nel descrivere i metodi attuali, i kit di strumenti disponibili e i set di dati su cui testare.

Mi capita di lavorare su un problema commerciale che richiede la regressione multi-target e ho scoperto che il toolkit Clus ha una buona miscela di alte prestazioni e robustezza

  • La documentazione è eccellente
  • Il toolkit ha diversi metodi sia per la classificazione multi-target che per la regressione
  • Supporta inoltre l'induzione e il clustering basati su regole.
  • I modelli di ensemble (Bagging, RandomForest) che ho usato possono essere letti e interpretati facilmente.

Alcuni dei metodi più recenti (post 2012) sono stati implementati come estensione del toolkit Mulan, ecco il link Github . Sebbene questi metodi come Combinazioni di target lineari casuali riportino prestazioni migliori rispetto ai modelli di ensemble, ho scoperto che il toolkit non è maturo come il toolkit Clus e quindi non li ha utilizzati.


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.