Precisione media e richiamo quando si utilizza la convalida incrociata


11

Ho eseguito la classificazione utilizzando più classificatori per dati etichettati in 2 classi e ho utilizzato la convalida incrociata 5 volte. Per ogni piega ho calcolato tp, tn, fp e fn. Quindi ho calcolato l'accuratezza, la precisione, il richiamo e il punteggio F per ciascun test. La mia domanda è: quando voglio fare la media dei risultati, ho preso la media delle accuratezze, ma posso anche mediare la precisione, il richiamo e anche il punteggio F? O sarebbe matematicamente sbagliato? PS I set di dati utilizzati in ogni piega sono ben bilanciati in termini di numero di istanze per classe.

Grazie.


3
Ho riscontrato il tuo stesso problema riguardo al calcolo della misura F (media armonica di precisione e richiamo) usando la validazione incrociata. In questo articolo hanno effettivamente dimostrato che il calcolo della misura F sull'insieme completo e non la media è il metodo meno distorto. Spero che questo possa aiutare
papafe,

3
@markusian Aggiungi questo come risposta! È di gran lunga la cosa più importante in questa pagina !!
drevicko,

Risposte:


2

Il punteggio , supponendo che tu stia utilizzando la solita definizione, è già una combinazione di precisione e richiamo. In particolare, è la loro media armonica. In altre parole Ha lo scopo di catturare l '"efficacia" di un sistema in cui il l'utente pone pesi uguali su precisione e richiamo. C'è un'estensione, chiamata score, che dà a volte più peso da ricordare della precisione. Attivo d'altra parte, se ti stai chiedendo se puoi fare una media della 5F

F1=2precisionrecallprecision+recall
Fββ
Fβ=(1+β2)precisionrecall(β2precision)+recall
Fi punteggi (uno per ogni piega), quindi la risposta è sì. In effetti, questo è il modo tipico di segnalare le prestazioni di un sistema!

Basta essere consapevoli del fatto che ci sono alcuni problemi con l'utilizzo di questi valori per fare inferenze sull'errore di generalizzazione dei classificatori. Ad esempio, un test tra i punteggi per un classificatore e i punteggi per un altro classificatore sarà troppo ottimista.tFF


Sì, ho usato la prima formula. Ciò significa che la media del punteggio F dai diversi test produce risultati simili alla precisione media e al richiamo e quindi il calcolo del punteggio F da essi. Ho provato questo sui risultati che ho ottenuto ed è stato quasi lo stesso. Grazie.
Kalaji,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.