In che modo la distanza di Gower calcola la differenza tra variabili binarie?


13

Ho 17 variabili numeriche e 5 binarie (0-1), con 73 campioni nel mio set di dati. Devo eseguire un'analisi del cluster. So che la distanza di Gower è una buona metrica per set di dati con variabili miste. Tuttavia, non riuscivo a capire come la distanza di Gower calcola la differenza tra variabili binarie . Mi sembra che non sia diverso dalla distanza euclidea.


La tua domanda non è del tutto chiara. Stai semplicemente chiedendo "in che modo la distanza di Gower calcola la differenza tra variabili binarie"? Che cosa significa "non c'è differenza rispetto all'euclideo"?
gung - Ripristina Monica

1
Grazie. Spiacenti, chiedo come Gower calcoli la differenza tra le variabili binarie. Voglio dire, non riuscivo a capire le differenze tra l'altro. Euclide e Gower per variabile binaria.
Emrah Bilgiç,

Hai cercato questo sito per Gower? stats.stackexchange.com/a/15313/3277
ttnphns

Si l'ho fatto. La distanza euclidea è 0, se entrambi i campioni hanno lo stesso valore, 1 in caso contrario. Che mi dici di Gower?
Emrah Bilgiç,

4
@ EmrahBilgiç, la metrica di Gower è somiglianza, non distanza. Diventa "distanza" quando viene sottratto da 1. Leggi sotto il link sopra come elabora i dati binari.
ttnphns,

Risposte:


5

Che ne dite di attributi binari che hanno i valori "m" e "f", per "maschio" e "femmina"?

Ti rendi conto che per una variabile dicotomica tutto ciò che puoi ottenere è "uguale" o "diverso"? La differenza del punto chiave tra le distanze non è se il valore è 1 o 0; ma come vengono combinate più variabili.


3

Gower distance utilizza Manhattan per calcolare la distanza tra punti dati continui e Dadi per calcolare la distanza tra punti dati categorici

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.