Ho una tabella di database di trasferimenti di dati tra nodi diversi. Questo è un enorme database (con quasi 40 milioni di trasferimenti). Uno degli attributi è il numero di trasferimenti di byte (nbyte) che vanno da 0 byte a 2 tera byte. Vorrei raggruppare gli nbyte in modo tale che, dati i cluster k, alcuni trasferimenti x1 appartengano al cluster k1, i transistor x2 a k2 ecc.
Dalla terminologia che ho usato potresti aver indovinato cosa stavo facendo: K-significa. Questi sono dati 1d poiché nbytes è l'unica caratteristica che mi interessa. Quando stavo cercando metodi diversi per questo, vidi che l'EM veniva menzionato un paio di volte insieme a un approccio non cluster. Mi piacerebbe conoscere le tue opinioni su come affrontare questo problema (in particolare se raggruppare o meno).
Grazie!