Devo prendere decisioni basate su misure di valutazione a media o macro media?


21

Ho eseguito una convalida incrociata di 10 volte su diversi algoritmi di classificazione binaria, con lo stesso set di dati, e ho ricevuto risultati medi sia su micro che su macro. Va detto che si trattava di un problema di classificazione multi-etichetta.

Nel mio caso, i veri negativi e i veri positivi sono ponderati allo stesso modo. Ciò significa che prevedere correttamente i veri negativi è altrettanto importante che prevedere correttamente i veri positivi.

Le misure a media media sono inferiori a quelle a media macro. Ecco i risultati di una rete neurale e supporto vettoriale macchina:

inserisci qui la descrizione dell'immagine

Ho anche eseguito un test di suddivisione percentuale sullo stesso set di dati con un altro algoritmo. I risultati furono:

inserisci qui la descrizione dell'immagine

Preferirei confrontare il test di suddivisione percentuale con i risultati con una media delle macro, ma è giusto? Non credo che i risultati a media macro siano di parte perché i veri positivi e i veri negativi sono ponderati allo stesso modo, ma poi mi chiedo se questo equivale a confrontare le mele con le arance?

AGGIORNARE

Sulla base dei commenti mostrerò come vengono calcolate le medie e le macro.

Ho 144 etichette (le stesse delle caratteristiche o degli attributi) che voglio prevedere. Precisione, richiamo e misura F sono calcolati per ciascuna etichetta.

---------------------------------------------------
LABEL1 | LABEL2 | LABEL3 | LABEL4 | .. | LABEL144
---------------------------------------------------
   ?   |    ?   |    ?   |   ?    | .. |     ?
---------------------------------------------------

Considerando una misura binaria di valutazione B (tp, tn, fp, fn) che viene calcolata sulla base dei veri positivi (tp), veri negativi (tn), falsi positivi (fp) e falsi negativi (fn). Le macro e micro medie di una misura specifica possono essere calcolate come segue:

inserisci qui la descrizione dell'immagine

inserisci qui la descrizione dell'immagine

Usando queste formule possiamo calcolare le medie micro e macro come segue:

inserisci qui la descrizione dell'immagine

inserisci qui la descrizione dell'immagine

Pertanto, le misure micro-media aggiungono tutte le tp, fp e fn (per ciascuna etichetta), dopodiché viene effettuata una nuova valutazione binaria. Le misure a media macro aggiungono tutte le misure (precisione, richiamo o misura F) e si dividono per il numero di etichette, che è più simile a una media.

Ora, la domanda è quale usare?


Quando chiedi quale utilizzare, qual è l'uso previsto? Scegli tra i due metodi, riassumendo i risultati o qualcos'altro?
Sean Easter,

1
L'uso previsto è quello di capire quale modello è il più superiore e di dire qualcosa su come si comporta bene. Ho scoperto che le misurazioni micro sono superiori secondo: Forman, George e Martin Scholz. "Mele alle mele negli studi di convalida incrociata: insidie ​​nella misurazione delle prestazioni del classificatore." Newsletter 12.1 (2010) di ACM SIGKDD Explorations: 49-57.
Kenci,

@Kenci, credo che dovresti pubblicarlo come risposta alla tua domanda e confermarlo come la risposta giusta. Grazie per il riferimento!
fnl

Risposte:


27

Se ritieni che tutte le etichette abbiano dimensioni più o meno uguali (hanno circa lo stesso numero di istanze), utilizza qualsiasi.

Se ritieni che ci siano etichette con più istanze di altre e se vuoi orientare la tua metrica verso quelle più popolate, usa micromedia .

Se ritieni che ci siano etichette con più istanze di altre e se vuoi orientare la tua metrica verso quelle meno popolate (o almeno non vuoi inclinare verso le più popolate), usa macromedia .

Se il risultato di micromedia è significativamente inferiore a quello di macromedia, significa che hai una grossolana classificazione errata nelle etichette più popolate, mentre le tue etichette più piccole sono probabilmente correttamente classificate. Se il risultato di macromedia è significativamente inferiore a quello di micromedia, significa che le etichette più piccole sono scarsamente classificate, mentre quelle più grandi sono probabilmente classificate correttamente.

Se non sei sicuro di cosa fare, vai avanti con i confronti sia sulla micro che sulla macro :)

Questo è un buon documento sull'argomento.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.