Il problema si riferisce alla costruzione di alberi decisionali. Secondo Wikipedia il " coefficiente di Gini " non deve essere confuso con "l' impurità di Gini ". Tuttavia, entrambe le misure possono essere utilizzate quando si costruisce un albero decisionale: possono supportare le nostre scelte quando si divide il set di elementi.
1) "Gini impurità" - è una metrica standard di suddivisione dell'albero decisionale (vedi nel link sopra);
2) "Coefficiente di Gini": ogni scissione può essere valutata in base al criterio AUC. Per ogni scenario di scissione possiamo costruire una curva ROC e calcolare la metrica AUC. Secondo Wikipedia AUC = (GiniCoeff + 1) / 2;
La domanda è: entrambe queste misure sono equivalenti? Da un lato, sono informato che il coefficiente di Gini non deve essere confuso con l'impurità di Gini. D'altra parte, entrambe queste misure possono essere utilizzate per fare la stessa cosa: valutare la qualità di una divisione dell'albero decisionale.