Risposte:
È stato creato un ampio indice di pagine Facebook ed è disponibile come torrent (è ~ 2.8Gb) http://btjunkie.org/torrent/Facebook-directory-personal-details-for-100-million-users/3979e54c73099d291605e7579b90838c2cd86a8e9575
I set di dati di Twitter sono taggati su Infochimps: http://infochimps.com/tags/twitter
Un set di dati lastfm è disponibile all'indirizzo http://mtg.upf.edu/node/1671
Ho appena trovato questo: 476 milioni di tweet di Twitter (tramite @yarapavan ).
Abbiamo curato un set di dati Twitter per gli amici degli utenti nel 2009 e poi nel 2009. Puoi trovare maggiori informazioni qui: http://strict.dista.uninsubria.it/?p=364
Grafico sociale di Facebook, installazioni di applicazioni e utenti di Last.fm, eventi, gruppi su http://odysseas.calit2.uci.edu/research/
Due set di dati (raccolti da aprile a maggio 2009) che contengono campioni rappresentativi di ~ 1 milione di utenti su Facebook, con alcune proprietà annotate: per ogni utente campionato, sono inclusi l'elenco degli amici, le impostazioni sulla privacy e l'appartenenza alla rete. Un terzo set di dati (raccolto febbraio 2008) include un grafico bipartito che rappresenta le installazioni di applicazioni da parte degli utenti di Facebook. Un quarto set di dati con utenti attivi giornalieri e installazioni di applicazioni nell'arco di 6 mesi (raccolti da settembre 2007 a febbraio 2008). Un quinto set di dati che include un campione rappresentativo di utenti Last.fm ottenuto utilizzando il campionamento multigraph (raccolto luglio 2010).
Una buona risorsa per trovare set di dati è:
/ r / set di dati su Reddit.
Un rapido sguardo a quella pagina rivela questa fonte , che potrebbe contenere qualcosa di utile per te.
Questo documento utilizza un set di dati di Facebook disponibile qui. Ecco la descrizione degli autori:
I dati includono l'insieme completo di nodi e collegamenti (e alcune informazioni demografiche) di 100 college e università statunitensi da una singola istantanea nel settembre 2005.