Facciamo un semplice esempio per illustrare come funzionano entrambi gli approcci.
Immagina di avere 3 classificatori (1, 2, 3) e due classi (A, B) e dopo l'allenamento stai predicendo la classe di un singolo punto.
Voto difficile
Pronostici :
Il classificatore 1 prevede la classe A
Il classificatore 2 prevede la classe B
Il classificatore 3 prevede la classe B
2/3 classificatori prevedono la classe B, quindi la classe B è la decisione d'insieme .
Voto morbido
Predizioni
(Questo è identico all'esempio precedente, ma ora espresso in termini di probabilità. I valori indicati solo per la classe A qui perché il problema è binario):
Il classificatore 1 prevede la classe A con una probabilità del 99%
Il classificatore 2 prevede la classe A con una probabilità del 49%
Il classificatore 3 prevede la classe A con una probabilità del 49%
La probabilità media di appartenere alla classe A attraverso i classificatori è (99 + 49 + 49) / 3 = 65.67%
. Pertanto, la classe A è la decisione d'insieme .
Quindi puoi vedere che nello stesso caso, il voto morbido e duro può portare a decisioni diverse. Il voto morbido può migliorare il voto duro perché tiene conto di più informazioni; utilizza l'incertezza di ciascun classificatore nella decisione finale. L'elevata incertezza nei classificatori 2 e 3 qui significa essenzialmente che la decisione dell'ensemble finale si basava fortemente sul classificatore 1.
Questo è un esempio estremo, ma non è raro che questa incertezza modifichi la decisione finale.