Un modo per assegnare un peso a una variabile è cambiando la sua scala. Il trucco funziona con gli algoritmi di clustering che menzioni, vale a dire. k-significa, collegamento medio ponderato e collegamento medio.
Kaufman, Leonard e Peter J. Rousseeuw. " Trovare gruppi nei dati: un'introduzione all'analisi dei cluster ". (2005) - pagina 11:
La scelta delle unità di misura genera pesi relativi delle variabili. Esprimere una variabile in unità più piccole porterà a un intervallo più ampio per quella variabile, che avrà quindi un grande effetto sulla struttura risultante. D'altra parte, standardizzando si tenta di dare a tutte le variabili un peso uguale, nella speranza di raggiungere l'obiettività. Come tale, può essere utilizzato da un professionista che non possiede alcuna conoscenza precedente. Tuttavia, può darsi che alcune variabili siano intrinsecamente più importanti di altre in una particolare applicazione, e quindi l'assegnazione dei pesi dovrebbe essere basata sulla conoscenza della materia (vedi, ad esempio, Abrahamowicz, 1985).
D'altra parte, ci sono stati tentativi di escogitare tecniche di clustering che sono indipendenti dalla scala delle variabili (Friedman e Rubin, 1967). La proposta di Hardy e Rasson (1982) è quella di cercare una partizione che minimizzi il volume totale degli scafi convessi dei cluster. In linea di principio, tale metodo è invariante rispetto alle trasformazioni lineari dei dati, ma sfortunatamente non esiste alcun algoritmo per la sua implementazione (tranne un'approssimazione limitata a due dimensioni). Pertanto, il dilemma della standardizzazione appare attualmente inevitabile e i programmi descritti in questo libro lasciano la scelta all'utente
Abrahamowicz, M. (1985), L'uso di informazioni non numeriche a pnon per misurare le differenze, articolo presentato al quarto incontro europeo della Società psicometrica e delle società di classificazione, 2-5 luglio, Cambridge (Regno Unito).
Friedman, HP e Rubin, J. (1967), su alcuni criteri invarianti per il raggruppamento dei dati. J. Amer. Statist. ASSOC6., 2, 1159-1178.
Hardy, A. e Rasson, JP (1982), Une nouvelle approche of problemes de class automatique, Statist. Anale. Donnies, 7, 41-56.