Scegliere tra le regole di punteggio appropriate


22

La maggior parte delle risorse sulle regole di punteggio adeguate menzionano una serie di regole di punteggio diverse come perdita di log, punteggio di Brier o punteggio sferico. Tuttavia, spesso non forniscono molte indicazioni sulle differenze tra loro. (Allegato A: Wikipedia .)

Scegliere il modello che massimizza il punteggio logaritmico corrisponde a scegliere il modello di massima verosimiglianza, che sembra un buon argomento per usare il punteggio logaritmico. Vi sono giustificazioni simili per Brier o punteggio sferico o altre regole di punteggio? Perché qualcuno dovrebbe usare uno di questi piuttosto che il punteggio logaritmico?


2
Alcuni suggerimenti sono nella nomenclatura. Il "costo funzionale" deriva dall'ottimizzazione o dalla progettazione ottimale del sistema di controllo. Non esiste un "migliore". Avere un "bene" significa che devi avere una misura di bontà. Ci sono un numero infinito di famiglie di misure di bontà. Un esempio banale è: qual è il percorso migliore? Se stai marciando per la tua esecuzione, rendila lunga e piacevole. Se stai andando al tuo Fields metal, rendilo il più breve. La competenza del sistema ti aiuta a selezionare la misura della bontà. Quando hai la misura della bontà, allora puoi trovare il "migliore".
EngrStudent - Ripristina Monica il


1
Mi sono preso la libertà di modificare il titolo per renderlo più preciso / informativo. Se l'ho interpretato male, mi dispiace e sentiti libero di ripristinare la modifica.
Richard Hardy,

Risposte:


18

Perché qualcuno dovrebbe usare uno di questi piuttosto che il punteggio logaritmico?

Quindi idealmente, distinguiamo sempre l' adattamento di un modello dal prendere una decisione . Nella metodologia bayesiana, il punteggio e la selezione dei modelli devono sempre essere eseguiti utilizzando la probabilità marginale . Quindi usi il modello per fare previsioni probabilistiche e la tua funzione di perdita ti dice come agire su tali previsioni.

Sfortunatamente nel mondo reale, le prestazioni computazionali spesso ci impongono di confondere la selezione del modello e il processo decisionale e quindi utilizzare una funzione di perdita per adattarci ai nostri modelli. È qui che si insinua la soggettività nella selezione dei modelli, perché devi indovinare quanto ti costeranno i diversi tipi di errore. L'esempio classico è una diagnosi di cancro: sopravvalutare la probabilità di un cancro di qualcuno non è buona, ma sottovalutarlo è molto peggio.

A parte questo, se stai cercando una guida su come scegliere una regola di punteggio, potresti anche voler cercare una guida sulla scelta di una funzione di perdita o sulla progettazione di una funzione di utilità, poiché penso che la letteratura su questi due argomenti sia molto più voluminoso.


3
1) Stai dicendo che il punteggio di Brier è essenzialmente una "funzione di perdita sotto mentite spoglie" - vale a dire, anche se si maschera come una regola di punteggio / confronto agnostico-funzione-utilità, viene effettivamente utilizzato perché le persone hanno preferenze specifiche sui tipi di errori che il modello fa?
Ben Kuhn,

2) Hai qualche esempio specifico di impostazione in cui qualcuno potrebbe scegliere un punteggio Brier o sferico rispetto al punteggio del log (= probabilità marginale, a quanto ho capito) per questi motivi?
Ben Kuhn,

3) Perché dovrebbe comportarsi meglio inserire nel modello le ipotesi relative alla perdita / utilità piuttosto che adattarsi alla probabilità marginale e utilizzare la funzione perdita / utilità quando si prende effettivamente la decisione? Sembra che per gli algoritmi di apprendimento ideali non ci dovrebbe essere alcun divario tra questi.
Ben Kuhn,

3
1) Sì 2) Non personalmente, no. Le regole di punteggio non sono "alla moda" nel pezzo di ML in cui lavoro. Avendo una rapida occhiata su Scholar , sembra che siano un po 'datate in generale. Questo documento sembra comunque interessante per te. 3) Per prestazione intendevo "prestazione computazionale", non "prestazione predittiva".
Andy Jones,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.