Come scegliere un buon punto operativo tra le curve di richiamo di precisione?


Risposte:


12

La definizione di "ottimale" dipenderà ovviamente dai tuoi obiettivi specifici, ma qui ci sono alcuni metodi relativamente "standard":

  • Punto EER (Equal Error Rate): il punto in cui la precisione è uguale al richiamo. Ad alcune persone questo sembra un punto operativo "naturale".

  • Una versione più raffinata e di principio di cui sopra è quella di specificare il costo dei diversi tipi di errori e ottimizzare tale costo. Supponiamo che erroneamente classificare un articolo (un errore in precisione) sia due volte più costoso di perdere completamente un articolo (errore nel richiamo). Quindi il miglior punto operativo è quello dove (1 - richiamo) = 2 * (1 - precisione).

  • In alcuni problemi le persone hanno un tasso minimo accettabile naturale di precisione o richiamo. Supponi di sapere che se oltre il 20% dei dati recuperati non è corretto, gli utenti smetteranno di utilizzare l'applicazione. Quindi è naturale impostare la precisione all'80% (o un po 'più in basso) e accettare qualunque richiamo tu abbia a quel punto.


2

In seguito al secondo e al terzo punto elenco di SheldonCooper: la scelta ideale è che qualcun altro faccia la scelta, sotto forma di soglia (punto 3) o di un compromesso in termini di costi (punto 2). E forse il modo migliore per offrire loro la scelta è con una curva ROC .


1

Non sono sicuro di quanto sia "standard", ma un modo sarebbe quello di scegliere il punto più vicino a (1, 1), ovvero il 100% di richiamo e la precisione del 100%. Sarebbe l'equilibrio ottimale tra le due misure. Questo presuppone che non apprezzi la precisione rispetto al richiamo o viceversa.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.