Qual è l'intuizione alla base della metrica variazione di informazioni (VI) per la convalida dei cluster?

Per i non statistici come me, è molto difficile catturare l'idea di VImetrica (variazione delle informazioni) anche dopo aver letto l'articolo pertinente di Marina Melia " Confronto di clustering - Una distanza basata sull'informazione " (Journal of Multivariate Analysis, 2007). In effetti, non ho familiarità con molti dei termini dei raggruppamenti là fuori.

Di seguito è riportato un MWE e vorrei sapere cosa significa l'output nelle diverse metriche utilizzate. Ho questi due cluster in R e nello stesso ordine di id:

> dput(a)
structure(c(4L, 3L, 4L, 4L, 4L, 4L, 4L, 3L, 4L, 4L, 3L, 3L, 3L, 
4L, 4L, 4L, 4L, 4L, 3L, 4L, 4L, 4L, 3L, 4L, 4L, 3L, 4L, 4L, 4L, 
1L, 1L, 4L, 4L, 4L, 4L, 4L, 4L, 3L, 4L, 4L, 3L, 4L, 4L, 2L, 2L, 
4L, 3L, 3L, 2L, 2L, 2L, 4L, 3L, 4L, 4L, 3L, 1L, 4L, 3L, 4L, 4L, 
4L, 3L, 4L, 4L, 4L, 4L, 2L, 2L, 2L, 4L, 3L, 4L, 4L, 4L, 4L, 4L, 
4L, 4L, 4L, 4L, 3L, 4L, 4L, 3L, 4L, 4L, 4L, 4L, 4L, 4L, 3L, 4L, 
4L, 3L, 4L, 4L, 4L, 4L, 4L, 4L, 3L, 4L, 4L, 4L, 4L, 2L, 2L, 4L
), .Label = c("1", "2", "3", "4"), class = "factor")
> dput(b)
structure(c(4L, 3L, 4L, 4L, 4L, 4L, 4L, 3L, 4L, 4L, 3L, 3L, 3L, 
4L, 4L, 3L, 4L, 4L, 3L, 4L, 4L, 4L, 3L, 4L, 4L, 3L, 4L, 4L, 4L, 
1L, 1L, 4L, 4L, 4L, 4L, 4L, 4L, 3L, 4L, 4L, 3L, 4L, 4L, 2L, 2L, 
4L, 3L, 3L, 2L, 2L, 2L, 4L, 3L, 4L, 4L, 3L, 1L, 4L, 3L, 4L, 4L, 
3L, 3L, 4L, 4L, 4L, 4L, 2L, 2L, 2L, 4L, 3L, 3L, 4L, 4L, 4L, 4L, 
4L, 4L, 4L, 4L, 3L, 4L, 4L, 3L, 4L, 4L, 4L, 4L, 4L, 4L, 3L, 4L, 
4L, 3L, 4L, 4L, 4L, 4L, 4L, 3L, 3L, 4L, 4L, 4L, 4L, 2L, 2L, 4L
), .Label = c("1", "2", "3", "4"), class = "factor")

Ora facendo confronti basati sia su VIaltre metriche / indici sia in ordine cronologico del loro aspetto in letteratura.

library(igraph)
  # Normalized Mutual Information (NMI) measure 2005:
compare(a, b, method = c("nmi")) 
[1] 0.8673525
  # Variation of Information (VI) metric 2003:
compare(a, b, method = c("vi")) 
[1] 0.2451685
  # Jaccard Index 2002:
clusteval::cluster_similarity(a, b, similarity = c("jaccard"), method = "independence") 
[1] 0.8800522
  # van Dongen S metric 2000:
compare(a, b, method = c("split.join")) 
[1] 8
  # Adjusted Rand Index 1985:
compare(a, b, method = c("adjusted.rand")) 
[1] 0.8750403
  # Rand Index 1971:
compare(a, b, method = c("rand")) 
[1] 0.9374788

Come puoi vedere, il VIvalore era diverso da tutti gli altri.

Cosa dice questo valore (e in che modo è correlato alla figura seguente)?
Quali sono le linee guida per considerare questo valore basso o alto?
Ci sono delle linee guida definite?

Forse gli esperti del settore possono fornire alcune descrizioni sensate per i laici come me quando provano a riferire tali risultati. Gradirei davvero se qualcuno fornisse anche linee guida per altre metriche (quando considerare il valore è grande o piccolo, cioè in relazione a una somiglianza tra due cluster).

Ho letto i thread CV correlati qui e qui , ma ancora non riesco a cogliere l'intuizione dietro VI. Qualcuno può spiegarlo in un inglese semplice?

La figura seguente è la figura 2 del documento sopra citato VI.

inserisci qui la descrizione dell'immagine

r clustering validation intuition

— dottorato
fonte

Tutte queste similitudini e metriche (notare la differenza tra i due tipi) misurano in un modo o nell'altro la quantità di frammentazione associata al più grande sotto-cluster comune tra le due partizioni. Usano tutti quella che è conosciuta come matrice di confusione. Considerando la formula precisa per VI, si può capire che sta misurando quella frammentazione. Suggerirei di guardare la formula in una delle pubblicazioni di Meila e anche di leggere le versioni normalizzate di tutte queste distanze, poiché tutte hanno scale diverse. Questo potrebbe essere il punto più importante.

— Micans,

Stavo anche lottando con l'interpretazione del VI e ho trovato questo articolo molto utile!

— Pizza,

È necessario rendersi conto che le misure possono avere interpretazioni diverse.

A giudicare dalla trama, un VI basso è buono.

1 - 0.2451685 = 0.7548315

che è molto più in linea con le altre misure.

Tuttavia, si noti che la maggior parte di queste misure misura qualcosa di diverso .

Non c'è motivo di presumere che solo perché una misura è 0,8, anche un'altra dovrebbe essere 0,8

— Ha QUIT - Anony-Mousse
fonte

Penso che il PO apprezzerebbe se tu potessi spiegare quali cose diverse misurano ciascuna di esse.

— gung - Ripristina Monica

Non li conosco abbastanza bene per spiegare ciascuno di essi. È chiaro che non hanno una scala / unità comparabili. Proprio come Volt e piedi non sono comparabili.

— Ha QUIT - Anony-Mousse