Perché il punteggio f beta definisce la beta in questo modo?


10

Questo è il punteggio F beta:

Fβ=(1+β2)precisionrecall(β2precision)+recall

L'articolo di Wikipedia afferma che .Fβ "measures the effectiveness of retrieval with respect to a user who attaches β times as much importance to recall as precision"

Non ho avuto l'idea. Perché definire questo modo? Posso definire F β in questo modo:βFβ

Fβ=(1+β)precisionrecall(βprecision)+recall

E come mostrare β times as much importance?


2
Scopri di seguito una risposta più recente che include il calcolo differenziale che affronta "perché Beta al quadrato e non Beta".
Javavba il

Risposte:


19

Consentendo che sia il peso nella prima definizione fornita e ˜ β il peso nella seconda, le due definizioni sono equivalenti quando si imposta ˜ β = β 2 , quindi queste due definizioni rappresentano solo differenze notazionali nella definizione del punteggio F β . L'ho visto definito sia nel primo modo (ad esempio sulla pagina di Wikipedia ) sia nel secondo (ad esempio qui ).ββ~β~=β2Fβ

La misura si ottiene prendendo la media armonica di precisione e richiamo, ovvero il reciproco della media del reciproco di precisione e il reciproco di richiamo:F1

F1=1121precision+121recall=2precisionrecallprecision+recall

Invece di usare pesi nel denominatore che sono uguali e si sommano a 1 ( per il richiamo e112 per precisione), potremmo invece assegnare pesi che comunque si sommano a 1 ma per i quali il peso al richiamo èβvolte maggiore del peso sulla precisione (β12β per il richiamo e1ββ+1 per precisione). Questo produce la tua seconda definizione delpunteggioFβ:1β+1Fβ

Fβ=11β+11precision+ββ+11recall=(1+β)precisionrecallβprecision+recall

Ancora una volta, se avessimo usato anziché β qui saremmo arrivati ​​alla tua prima definizione, quindi le differenze tra le due definizioni sono solo notazionali.β2β


1
β

1
Il calcolo differenziale che affronta "perché Beta al quadrato e non Beta" è incluso in una risposta più recente di seguito.
Javavba,

β(1+β)precisionrecallβprecision

6

β2ββ

β2

P/RE/R=E/PE=E(P,R)

La motivazione per questo essere:

P/R

β2PRPRE1FEF

F=1(αP+1αR)

F/P=α(αP+1αR)2P2

F/R=1α(αP+1αR)2R2

αP/RβR/P

F/P=F/RαP2=1αR2RP=1αα

βαβ2

β=1ααβ2=1ααβ2+1=1αα=1β2+1

1α=11β2+1β2β2+1

Otteniamo:

F=1(1β2+11P+β2β2+11R)

Che può essere riorganizzato per dare il modulo nella tua domanda.

ββ2βββ

Potresti definire un punteggio come suggerisci, tuttavia dovresti essere consapevole che in questo caso o l'interpretazione discussa non vale più o stai implicando qualche altra definizione per quantificare il compromesso tra precisione e richiamo.

Note:

  1. P/R

Riferimenti:

  1. CJ Van Rijsbergen. 1979. Information Retrieval (2nd ed.), Pagg. 133-134
  2. Y. Sasaki. 2007. "La verità della misura F", materiale didattico e didattico

1
Questa dovrebbe essere la risposta accettata.
Javavba il

3

Per segnalare qualcosa rapidamente.

Ciò significa che all'aumentare del valore beta, dai maggiore valore alla precisione.

In realtà penso che sia l'opposto - poiché più alto è meglio nel punteggio F-β, vuoi che il denominatore sia piccolo. Pertanto, se si riduce β, il modello viene punito meno per avere un buon punteggio di precisione. Se aumenti β, il punteggio F-β viene punito di più quando la precisione è alta.

Se vuoi ponderare il punteggio F-β in modo che valuti la precisione, β dovrebbe essere 0 <β <1, dove β-> 0 valuta solo la precisione (il numeratore diventa molto piccolo e l'unica cosa nel denominatore è il richiamo, quindi il punteggio F-β diminuisce all'aumentare del richiamo).

http://scikit-learn.org/stable/modules/generated/sklearn.metrics.fbeta_score.html


0

Il motivo per cui β ^ 2 viene moltiplicato con precisione è proprio il modo in cui vengono definiti i punteggi F. Ciò significa che all'aumentare del valore beta, dai maggiore valore alla precisione. Se volessi moltiplicarlo con il richiamo che avrebbe funzionato, significherebbe solo che quando il valore beta aumenta, il valore richiama maggiormente.


0

Il valore beta maggiore di 1 significa che vogliamo che il nostro modello presti maggiore attenzione al modello Richiamo rispetto a Precisione. Dall'altro, un valore inferiore a 1 pone maggiormente l'accento sulla precisione.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.