Risposte:
Molti classificatori possono prevedere punteggi continui. Spesso, i punteggi continui sono risultati intermedi che vengono convertiti solo in etichette di classe (di solito per soglia) come l'ultimo passo della classificazione. In altri casi, ad esempio, è possibile calcolare le probabilità posteriori per l'appartenenza alla classe (ad esempio analisi discriminante, regressione logistica). È possibile calcolare l'MSE utilizzando questi punteggi continui anziché le etichette di classe. Il vantaggio è che si evita la perdita di informazioni a causa della dicotomizzazione.
Quando il punteggio continuo è una probabilità, la metrica MSE viene chiamata punteggio di Brier.
Tuttavia, ci sono anche problemi di classificazione che sono piuttosto problemi di regressione sotto mentite spoglie. Nel mio campo ciò potrebbe essere, ad esempio, la classificazione dei casi a seconda che la concentrazione di una sostanza superi o meno un limite legale (che è un problema binario / discriminatorio di due classi). Qui, MSE è una scelta naturale a causa della natura di regressione sottostante dell'attività.
In questo articolo lo spieghiamo come parte di un quadro più generale:
C. Beleites, R. Salzer e V. Sergo:
Convalida di modelli di classificazione soft utilizzando appartenenze a classi parziali: un concetto esteso di sensibilità e Co. applicato alla classificazione dei tessuti di astrocitoma
Chemom. Intell. Laboratorio. Syst., 122 (2013), 12-22.
Come calcolarlo: se lavori in R, un'implementazione è nel pacchetto "softclassval", http: /softclassval.r-forge.r-project.org.
Non capisco bene come ... la classificazione riuscita sia una variabile binaria (corretta o no), quindi è difficile vedere cosa si quadrerebbe.
Generalmente le classificazioni vengono misurate su indicatori come la percentuale corretta, quando una classificazione che è stata stimata da un set di addestramento, viene applicata a un set di test che è stato accantonato in precedenza.
L'errore quadratico medio può certamente essere (ed è) calcolato per previsioni o valori previsti di variabili continue, ma non credo per le classificazioni.
Per le stime di probabilità dovresti calcolare non MSE ma invece la probabilità:
Questa probabilità è per una risposta binaria, che si presume abbia una distribuzione di Bernoulli.
Se si prende il registro di e poi si annulla, si ottiene la perdita logistica, che è una sorta di analogo di MSE per quando si ha una risposta binaria. In particolare, MSE è la probabilità logaritmica negativa per una risposta continua che si presume abbia una distribuzione normale.
Tecnicamente puoi, ma la funzione MSE non è convessa per la classificazione binaria. Pertanto, se un modello di classificazione binaria viene addestrato con la funzione Costo MSE, non è garantito minimizzare la funzione Costo . Inoltre, l'utilizzo di MSE come funzione di costo presuppone la distribuzione gaussiana che non è il caso della classificazione binaria.