Come posso affrontare un problema di classificazione in cui una delle classi è definita da "nessuna delle altre"


9

Supponiamo che io sia interessato a tre classi , , . Ma il mio set di dati contiene in realtà diverse altre classi reali .c1c2c3(cj)j=4n

La risposta ovvia è definire una nuova classe che riferimento a tutte le classi , ma sospetto che questa non sia una buona idea poiché i campioni in saranno rari e non molto simili tra loro.c^4cjj>3c^4

Per visualizzare ciò che sto cercando di dire, supponiamo di avere i seguenti due spazi variabili e le classi , , , sono rappresentate in rosso, fino, verde e nero rispettivamente. È così che sospetto che i miei dati sarebbero simili.c1c2c3c^4=j=4ncj

inserisci qui la descrizione dell'immagine

Esiste un modo standard per affrontare questo problema? Quale sarebbe il classificatore più efficiente e perché?


Prendi in considerazione l'uso di uno contro resto en.wikipedia.org/wiki/Multiclass_classification#One-vs.-rest
DaL

1
Potresti voler esplorare modelli senza etichetta positivi . Sembra un problema simile, tranne per il fatto che è multiclasse, non binario come la maggior parte dei problemi PU.
Ricardo Cruz,

Risposte:


4

c4^

c4^

c1,c2,c3

centj=xiD:yi=jxixiD:yi=j1c1,c2,c3,c4^


Il suggerimento di Bogas è ottimo se non hai molte sovrapposizioni di classe. Altrimenti, scegli un modello con più etichette.
Ricardo Cruz,

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.