La media armonica è l'equivalente della media aritmetica per i reciproci delle quantità che dovrebbero essere mediate dalla media aritmetica. Più precisamente, con la media armonica, trasformi tutti i tuoi numeri nella forma "mediabile" (prendendo il reciproco), prendi la loro media aritmetica e poi trasformi il risultato nella rappresentazione originale (riprendendo il reciproco).
La precisione e il richiamo sono "naturalmente" reciproci perché il loro numeratore è lo stesso ei loro denominatori sono diversi. Le frazioni sono più sensibili alla media per media aritmetica quando hanno lo stesso denominatore.
Per più intuizione, supponiamo di mantenere costante il numero di elementi positivi veri. Quindi, prendendo la media armonica della precisione e del richiamo, si prende implicitamente la media aritmetica dei falsi positivi e dei falsi negativi. Fondamentalmente significa che i falsi positivi e i falsi negativi sono ugualmente importanti per te quando i veri positivi rimangono gli stessi. Se un algoritmo ha N più elementi falsi positivi ma N meno falsi negativi (pur avendo gli stessi veri positivi), la misura F rimane la stessa.
In altre parole, la misura F è adatta quando:
- gli errori sono ugualmente negativi, siano essi falsi positivi o falsi negativi
- il numero di errori è misurato rispetto al numero di veri positivi
- i veri negativi non sono interessanti
Il punto 1 può o non può essere vero, ci sono varianti ponderate della misura F che possono essere utilizzate se questa ipotesi non è vera. Il punto 2 è abbastanza naturale poiché possiamo aspettarci che i risultati vengano ridimensionati se classifichiamo sempre più punti. I numeri relativi dovrebbero rimanere gli stessi.
Il punto 3 è piuttosto interessante. In molte applicazioni i negativi sono l'impostazione predefinita naturale e può anche essere difficile o arbitrario specificare ciò che conta veramente come un vero negativo. Ad esempio, un allarme antincendio ha un vero evento negativo ogni secondo, ogni nanosecondo, ogni volta che è trascorso il tempo di Planck, ecc. Anche un pezzo di roccia ha questi veri eventi negativi di rilevamento incendio tutto il tempo.
O in un caso di rilevamento del volto, la maggior parte delle volte " non restituisci correttamente " miliardi di possibili aree nell'immagine, ma questo non è interessante. I casi interessanti sono quando si fa restituire un rilevamento proposto o quando si dovrebbe restituirlo.
Al contrario, l'accuratezza della classificazione si preoccupa allo stesso modo dei veri positivi e dei veri negativi ed è più adatta se il numero totale di campioni (eventi di classificazione) è ben definito e piuttosto piccolo.