Sto cercando di valutare le prestazioni del clustering. Stavo leggendo la documentazione di skiscit-learn sulle metriche . Non capisco la differenza tra ARI e AMI. Mi sembra che facciano la stessa cosa in due modi diversi.
Citando dalla documentazione:
Data la conoscenza delle assegnazioni della classe di verità di base labels_true e delle assegnazioni del nostro algoritmo di clustering degli stessi campioni labels_pred, l' indice Rand rettificato è una funzione che misura la somiglianza dei due compiti, ignorando le permutazioni e con la normalizzazione casuale.
vs
Data la conoscenza delle assegnazioni della classe di verità di base labels_true e delle assegnazioni del nostro algoritmo di clustering degli stessi campioni labels_pred, le informazioni reciproche sono una funzione che misura l'accordo dei due compiti, ignorando le permutazioni ... L'AMI è stata proposta più di recente ed è normalizzata contro opportunità.
Dovrei usarli entrambi nella mia valutazione del clustering o questo sarebbe ridondante?