Il coefficiente di dadi (noto anche come indice di somiglianza dei dadi) è uguale al punteggio F1 , ma non è uguale alla precisione. La differenza principale potrebbe essere il fatto che l'accuratezza tiene conto dei veri negativi mentre il coefficiente dei dadi e molte altre misure gestiscono solo i veri negativi come valori predefiniti poco interessanti (vedere Le basi della valutazione del classificatore, Parte 1 ).
Per quanto ne so, il coefficiente dei dadi non è calcolato come descritto da una risposta precedente , che in realtà contiene la formula per l' indice di Jaccard (noto anche come "intersezione sull'unione" nella visione artificiale).
Dice(A,B)F1(A,B)Jaccard(A,B)Accuracy(A,B)=2|A⋅B||A|+|B|=2|A|/|A⋅B|+|B|/|A⋅B|=|A⋅B||max(A,B)|=|A⋅B||A|+|B|−|A⋅B|=|A⋅B|+|A¯¯¯¯⋅B¯¯¯¯||All|
Dove vettori binari (con valori di 1 per gli elementi all'interno di un gruppo e 0 altrimenti), uno indica la verità di base e l'altro indica il risultato della classificazione, e è solo tutti gli elementi considerati (un vettore binario di 1 dello stesso lunghezza). Ad esempio,(prodotto interno di e ) è il numero di veri positivi,(prodotto interno del complemento di e del complemento di ) è il numero di veri negativi.A l l | A ⋅ B | A B | ¯ A ⋅ ¯ B | A BA,BAll|A⋅B|AB|A¯¯¯¯⋅B¯¯¯¯|AB
Il coefficiente di dadi e l'indice di Jaccard sono monotonicamente correlati e l'indice di Tversky li generalizza entrambi, per leggere di più su di esso vedere i punteggi F, i dadi e Jaccard impostare la somiglianza .
Il coefficiente Dice è anche la media armonica di Sensibilità e Precisione, per capire perché ha senso, leggi Perché la misura F è una media armonica e non una media aritmetica delle misure di precisione e richiamo? .
Per saperne di più su molti dei termini di questa risposta e le loro relazioni, vedere Valutazione dei classificatori binari .