Sfondo: ci sono alcune grandi domande / risposte qui su come calibrare i modelli che prevedono le probabilità che si verifichi un risultato. Per esempio
- Punteggio di Brier e sua scomposizione in risoluzione, incertezza e affidabilità .
- Grafici di calibrazione e regressione isotonica .
Questi metodi spesso richiedono l'uso di un metodo di binning sulle probabilità previste, in modo che il comportamento del risultato (0, 1) sia livellato sul cestino prendendo il risultato medio.
Problema: tuttavia, non riesco a trovare nulla che mi istruisca su come scegliere la larghezza del cestino.
Domanda: Come posso scegliere la larghezza ottimale del cestino?
Tentativo: due larghezze di bin comuni in uso sembrano essere:
- Binning di uguale larghezza, ad es. 10 bin ciascuno che copre il 10% dell'intervallo [0, 1].
- Il metodo di binning di Tukey discusso qui .
Ma queste scelte dei cassonetti sono le più ottimali se si fosse interessati a trovare gli intervalli nelle probabilità previste che sono maggiormente calibrate?