Statistics.com ha pubblicato un problema della settimana: il tasso di frode assicurativa residenziale è del 10% (uno su dieci è fraudolento). Un consulente ha proposto un sistema di apprendimento automatico per esaminare i reclami e classificarli come frodi o no. Il sistema è efficace al 90% nel rilevare i reclami fraudolenti, ma solo l'80% nel classificare correttamente i reclami non fraudolenti (etichetta erroneamente uno su cinque come "frode"). Se il sistema classifica un reclamo come fraudolento, qual è la probabilità che sia realmente fraudolento?
https://www.statistics.com/news/231/192/Conditional-Probability/?showtemplate=true
Io e il mio pari abbiamo trovato la stessa risposta in modo indipendente e non corrisponde alla soluzione pubblicata.
La nostra soluzione:
(0,9 * 0,1) / ((. 9 * .1) + (. 2 * .9)) = 1/3
La loro soluzione:
Questo è un problema con probabilità condizionata. (È anche un problema bayesiano, ma l'applicazione della formula nella regola di Bayes aiuta solo a oscurare quello che sta succedendo.) Prendi in considerazione 100 affermazioni. 10 saranno fraudolenti e il sistema ne etichetterà correttamente 9 come "frode". 90 reclami andranno bene, ma il sistema classificherà erroneamente 72 (80%) come "frode". Quindi sono state etichettate in totale 81 affermazioni come fraudolento, ma solo 9 di loro, l'11%, sono in realtà fraudolenti.
Chi aveva ragione