Perché il richiamo non tiene conto dei veri negativi? Negli esperimenti in cui i veri negativi sono importanti tanto quanto i veri positivi, è la loro metrica comparabile che ne tiene conto?
Perché il richiamo non tiene conto dei veri negativi? Negli esperimenti in cui i veri negativi sono importanti tanto quanto i veri positivi, è la loro metrica comparabile che ne tiene conto?
Risposte:
Il richiamo (in combinazione con la precisione) viene generalmente utilizzato nelle aree in cui si è principalmente interessati a trovare i positivi. Un esempio per tale area è ad esempio Performance Marketing o (come già suggerito dal link ch'ls) l'area di recupero delle informazioni.
Così:
Se sei principalmente interessato a trovare gli aspetti negativi, "True Negative Rate" (come già suggerito da chl) è la strada da percorrere. Ma non dimenticare di guardare una metrica "precisione per concentrarsi sui negativi" (cioè , perché altrimenti il "Vero tasso negativo" può essere ottimizzato impostando la previsione su "Negativo" per tutti i punti dati).
Se sei interessato ad ottimizzare il richiamo sia per i negativi che per i positivi, dovresti guardare "Precisione" (vedi di nuovo il link di chl). Ma fai attenzione all'inclinazione della classe (ovvero hai molti più aspetti positivi che negativi o viceversa ... in questo caso puoi "ottimizzare" l'accuratezza impostando la previsione sulla classe principale per tutti i punti dati).