Come applicare le reti neurali su problemi di classificazione multi-etichetta?


12

Descrizione:

Lascia che il dominio problematico sia la classificazione dei documenti in cui esiste una serie di vettori di caratteristiche, ciascuno appartenente a 1 o più classi. Ad esempio, un documento doc_1potrebbe appartenere Sportse Englishcategorie.

Domanda:

Usando la rete neurale per la classificazione, quale sarebbe l'etichetta per un vettore caratteristica? sarebbe un vettore costituito da tutte le classi in modo tale che 0 valore sia dato alle classi non rilevanti e 1 per le classi pertinenti? Quindi se l'elenco delle etichette delle classi è [Sports, News, Action, English, Japanese], allora per il documento doc_1l'etichetta sarebbe [1, 0, 0, 1, 0]?

Risposte:


3

Sì, nell'apprendimento multi-etichetta le informazioni sull'etichetta sono spesso codificate come vettore binario che hai descritto. È anche più facile quindi per la valutazione.

Potremmo voler controllare MULAN , una libreria Java open source per l'apprendimento multi-etichetta. È un'estensione Weka e ha implementato molti classificatori multi-etichetta, comprese le reti neurali. Ad esempio, puoi trovare BP-MLL qui .


8

Questo sembra essere il documento che stai cercando:

Min-Ling Zhang e Zhi-Hua Zhou: reti neurali multi-etichetta con applicazioni alla genomica funzionale e alla categorizzazione del testo

Dall'abstract:

Nell'apprendimento multi-etichetta, ogni istanza nel set di formazione è associata a un set di etichette e il compito è quello di produrre un set di etichette la cui dimensione è sconosciuta a priori per ogni istanza invisibile. In questo documento, questo problema è affrontato nel modo in cui viene proposto un algoritmo di rete neurale chiamato BP-MLL, ovvero Backpropagation for Multi-Label Learning. ... Le applicazioni a due problemi di apprendimento multi-etichetta del mondo reale, ovvero la genomica funzionale e la categorizzazione del testo, mostrano che le prestazioni di BP-MLL sono superiori a quelle di alcuni algoritmi di apprendimento multi-etichetta ben consolidati.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.