Ho usato la funzione h2o.glm () in R che fornisce una tabella di contingenza nel risultato insieme ad altre statistiche. La tabella di contingenza è intitolata " Tabulazione incrociata basata sulla soglia ottimale F1 "
Wikipedia definisce il punteggio F1 o il punteggio F come media armonica di precisione e richiamo. Ma la precisione e il richiamo non vengono trovati solo quando il risultato dei valori previsti di una regressione logistica (ad esempio) viene trasformato in binario usando un limite.
Ora, per cutoff, ricordo qual è la connessione tra il punteggio F1 e la soglia ottimale. Come viene calcolata la soglia ottimale? Come viene calcolata la soglia ottimale F1?
Scusa se mi sono perso qualcosa, sono nuovo alle statistiche qui.