Ho addestrato due modelli (classificatori binari usando h2o AutoML) e voglio selezionarne uno da usare. Ho i seguenti risultati:
model_id auc logloss logloss_train logloss_valid gini_train gini_valid
DL_grid_1 0.542694 0.287469 0.092717 0.211956 0.872932 0.312975
DL_grid_2 0.543685 0.251431 0.082616 0.186196 0.900955 0.312662
le colonne auce loglosssono le metriche di convalida incrociata (la convalida incrociata utilizza solo i dati di addestramento). le metriche ..._traine ..._validsi trovano eseguendo rispettivamente le metriche di addestramento e convalida attraverso i modelli. Voglio usare il logloss_valido il gini_validper scegliere il modello migliore.
Il modello 1 ha un gini migliore (cioè una migliore AUC) ma il modello due ha una perdita di log migliore. La mia domanda è quale scegliere quale penso che pone la domanda, quali sono i vantaggi / gli svantaggi dell'utilizzo di gini (AUC) o logloss come metrica di decisione.