Sto imparando la classificazione SVM e ho riscontrato un problema. Non sono sicuro che questo dilemma abbia una sua terminologia.
Supponiamo che vorremmo classificare il paziente per SVM dati i campioni di persone sane (di entrambi i sessi) e persone con cancro al fegato (di entrambi i sessi). Se etichettiamo le persone sane che campionano come classe 1 e le persone con cancro come classe 2, possiamo formare un SVM binario e ottenere un classificatore 1 per predire qualsiasi nuovo paziente. Ora, immagina un altro scenario. Supponiamo che prima dividiamo tutti i campioni per genere prima della classificazione SVM. Per ogni genere, etichettiamo ancora pazienti sani contro pazienti cancerosi in 2 classi e formiamo un SVM binario per ottenere rispettivamente il classificatore 2 e il classificatore 3 per campioni femminili e maschili. La domanda è se esiste una nuova paziente, quale classificatore, 1 o 2, dovrebbe essere usato per ottenere una previsione più accurata? Ecco il dilemma per gli argomenti che ho
(1) Quando il numero di campioni è elevato, la previsione dovrebbe essere più accurata. Sulla base di questo argomento, il classificatore 1 sembra una buona scelta.
(2) Tuttavia, se dividiamo prima i campioni in gruppi femminili e maschili, il classificatore 2 sembra una scelta migliore poiché il nuovo paziente (campione sconosciuto) è femmina.
Questo tipo di dilemma ha una terminologia o qualcuno conosce ulteriori informazioni o come risolvere un problema del genere? Non sono nemmeno sicuro che si tratti di una domanda legittima e mi scuso per l'ingenua domanda in anticipo. Grazie