Esistono diversi set di dati classici per le attività di classificazione / regressione di apprendimento automatico. I più popolari sono:
Ma qualcuno conosce set di dati simili per l'analisi di reti / teoria dei grafi? Più concreto - Sto cercando set di dati standard Gold per il confronto / valutazione / apprendimento:
- misure di centralità;
- algoritmi di clustering di rete.
Non ho bisogno di un vasto elenco di reti / grafici disponibili pubblicamente, ma un paio di set di dati realmente indispensabili.
MODIFICARE:
È abbastanza difficile fornire funzionalità esatte per "set di dati standard", ma ecco alcuni pensieri. Penso che il vero set di dati classico dovrebbe soddisfare questi criteri:
- Riferimenti multipli in articoli e libri di testo;
- Inclusione in noti pacchetti software di analisi di rete;
- Tempo sufficiente di esistenza;
- Utilizzo in numerosi corsi sull'analisi dei grafici.
Per quanto riguarda il mio campo di interesse, ho anche bisogno di classi etichettate per vertici e / o "punteggi di autorità" precompilati (o predefiniti) (ovvero stime di centralità). Dopo aver fatto questa domanda ho continuato a cercare, ed ecco alcuni esempi adatti:
- Zachary's Karate Club : introdotto nel 1977, citato più di 1,5k volte (secondo Google Scholar), i vertici hanno l'attributo Faction (che può essere utilizzato per il clustering).
- Rete di collaborazione Erdos : sfortunatamente, non ho trovato questa rete in forma di file di dati, ma è piuttosto famosa e se qualcuno arricchirà la rete con i dati di specializzazione dei matematici, potrebbe anche essere usato per testare algoritmi di clustering.