Ho lavorato su un nuovo metodo per analizzare e analizzare set di dati per identificare e isolare sottogruppi di una popolazione senza conoscere in anticipo le caratteristiche di alcun sottogruppo. Mentre il metodo funziona abbastanza bene con campioni di dati artificiali (ovvero set di dati creati appositamente allo scopo di identificare e separare sottoinsiemi della popolazione), mi piacerebbe provare a testarlo con dati in tempo reale.
Quello che sto cercando è una fonte di dati liberamente disponibile (cioè non riservata, non proprietaria). Preferibilmente uno contenente distribuzioni bimodali o multimodali o essendo ovviamente costituito da più sottoinsiemi che non possono essere facilmente separati mediante mezzi tradizionali. Dove andrei a trovare tali informazioni?