Prima di tutto, trovo che la "precisione" a volte sia un po 'fuorviante, in quanto si riferisce a cose distinte:
Il termine accuratezza nel geneale per la valutazione di sistemi o metodi (sono chimico analitico) si riferisce alla distorsione delle previsioni, ovvero risponde alla domanda su come siano in media buone previsioni.
Come sapete, ci sono molte diverse misure di prestazione che rispondono a diversi aspetti delle prestazioni per i classificatori. Uno di questi sembra essere chiamato anche accuratezza. Se il tuo documento non è per un pubblico di apprendimento / classificazione automatico, raccomando di chiarire questa distinzione. Anche per questo significato più specifico di accuratezza sarei molto esplicito di ciò che chiamo accuratezza poiché potrebbero verificarsi di nuovo diversi modi di gestire lo squilibrio di classe. In genere, lo squilibrio di classe viene ignorato, portando al noto calcolo . Tuttavia, è anche possibile utilizzare la media di sensibilità e specificità, che equivale a controllare lo squilibrio di classe ponderando la media.TP+TNall cases
Il punteggio F viene spesso introdotto come media armonica di precisione e richiamo (o valore predittivo positivo e sensibilità). Per la tua domanda, penso che sia utile spiegarlo ulteriormente e semplificarlo:
F=2⋅precision⋅recallprecision+recall=2TPall PTPallTTPall P+TPallT=2TP2all P⋅allTTP⋅all Tall P⋅allT+TP⋅all Pall P⋅allT=2 TP2TP⋅all T+TP⋅all P=2 TPall T+all P
L'ultima espressione non è una frazione di nulla che io possa pensare a un determinato gruppo di casi di test. In particolare, si prevede una (pesante) sovrapposizione tra i casi VERO e POSITIVO. Ciò mi impedirebbe di esprimere un punteggio F in percentuale in quanto tale tipo implica una proporzione di casi. In realtà, penso che avvertirei il lettore che F-score non ha una tale interpretazione.