Ho addestrato due modelli (classificatori binari usando h2o AutoML) e voglio selezionarne uno da usare. Ho i seguenti risultati:
model_id auc logloss logloss_train logloss_valid gini_train gini_valid
DL_grid_1 0.542694 0.287469 0.092717 0.211956 0.872932 0.312975
DL_grid_2 0.543685 0.251431 0.082616 0.186196 0.900955 0.312662
le colonne auc
e logloss
sono le metriche di convalida incrociata (la convalida incrociata utilizza solo i dati di addestramento). le metriche ..._train
e ..._valid
si trovano eseguendo rispettivamente le metriche di addestramento e convalida attraverso i modelli. Voglio usare il logloss_valid
o il gini_valid
per scegliere il modello migliore.
Il modello 1 ha un gini migliore (cioè una migliore AUC) ma il modello due ha una perdita di log migliore. La mia domanda è quale scegliere quale penso che pone la domanda, quali sono i vantaggi / gli svantaggi dell'utilizzo di gini (AUC) o logloss come metrica di decisione.