Ho letto l'articolo di Alexandru Niculescu-Mizil e Rich Caruana "Come ottenere probabilità calibrate dall'aumento " e la discussione in questo thread. Tuttavia, ho ancora problemi a comprendere e implementare la logistica o il ridimensionamento di Platt per calibrare l'output del mio classificatore boosting multi-classe (boost delicato con blocchi di decisione).
Ho una certa familiarità con i modelli lineari generalizzati e penso di capire come funzionano i metodi logistici e di calibrazione di Platt nel caso binario, ma non sono sicuro di sapere come estendere il metodo descritto nel documento al caso multi-classe.
Il classificatore che sto utilizzando genera quanto segue:
- = Numero di voti che il classificatore lancia per la classe per il campione che viene classificato
- = Classe stimata
A questo punto ho le seguenti domande:
Q1: Devo usare un log multinomiale per stimare le probabilità? o posso ancora farlo con la regressione logistica (ad es. in un modo 1 contro tutti )?
Q2: Come devo definire le variabili target intermedie (ad es. Come nel ridimensionamento di Platt) per il caso multi-classe?
Q3: Capisco che potrebbe essere molto da chiedere, ma qualcuno sarebbe disposto a delineare lo pseudo-codice per questo problema? (a livello più pratico, sono interessato a una soluzione in Matlab).