Clustering con misure di distanza asimmetriche


9

Come si raggruppa una funzione con una misura di distanza asimmetrica?

Ad esempio, supponiamo che stai raggruppando un set di dati con i giorni della settimana come funzionalità: la distanza dal lunedì al venerdì non è uguale alla distanza dal venerdì al lunedì.

Come si incorpora questo nella misura della distanza dell'algoritmo di clustering?

Risposte:


3

Se la distanza MF è asimmetrica perché il futuro è diverso dal passato, è richiesto un autentico raggruppamento asimmetrico. Innanzitutto, è necessario definire una funzione di distanza asimmetrica.

Un modo per un cluster asimmetrico, data una funzione di distanza, è incorporare i dati originali in un nuovo spazio di coordinate. Vedi "Strutture geometriche di alcuni modelli non a distanza per MDS asimmetrico" di Naohito Chino e Kenichi Shiraiwa, Behaviormetrika, 1992 ( pdf ). Questo si chiama HCM (il modello canonico eremitico).

H

Hioj=12[d(Xio,Xj)+d(Xj,Xio)]+io12[d(Xio,Xj)-d(Xj,Xio)]

Questo trasforma i dati in uno spazio di numeri complessi. Una volta incorporati i dati, la distanza tra gli oggetti xey è solo x * y, dove * è la trasposizione coniugata. A questo punto puoi eseguire k-mean sui vettori complessi.

Anche il clustering asimmetrico spettrale è stato realizzato, vedi la tesi di Stefan Emilov Atev, "Utilizzo dell'asimmetria nel clustering spettrale di traiettorie", Università del Minnesota, 2011, che fornisce il codice MATLAB per un algoritmo speciale.


1

Puoi prendere una sorta di media (come una media aritmetica o, per distribuzioni di probabilità, la radice quadrata della divergenza di Jensen-Shannon).


1

Dovresti dare un'occhiata alle statistiche circolari (se vuoi lavorare "entro" una settimana di accordatura)


1

XXTX

|giorni a parte|

XD

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.