In diverse competizioni kaggle il punteggio si basava sulla "perdita di log". Ciò si riferisce all'errore di classificazione.
Ecco una risposta tecnica ma sto cercando una risposta intuitiva. Mi sono piaciute molto le risposte a questa domanda sulla distanza di Mahalanobis, ma PCA non è in perdita.
Posso usare il valore emesso dal mio software di classificazione, ma non lo capisco davvero. Perché lo usiamo al posto dei tassi vero / falso positivo / negativo? Potete aiutarmi in modo da poterlo spiegare a mia nonna o a un principiante nel campo?
Mi piace anche e sono d'accordo con la citazione:
non capisci davvero qualcosa a meno che tu non possa spiegarlo a tua nonna
- Albert Einstein
Ho provato a rispondere da solo prima di pubblicare qui.
I collegamenti che non ho trovato intuitivi o davvero utili includono:
- http://www.r-bloggers.com/making-sense-of-logarithmic-loss/
- https://www.quora.com/What-is-an-intuitive-explanation-for-the-log-loss-function
- https://lingpipe-blog.com/2010/11/02/evaluating-with-probabilistic-truth-log-loss-vs-0-1-loss/
- https://www.kaggle.com/wiki/LogarithmicLoss
Questi sono informativi e precisi. Sono pensati per un pubblico tecnico. Non disegnano un'immagine semplice né forniscono esempi semplici e accessibili. Non sono scritti per mia nonna.