Je recherche des jeux de données de réseaux sociaux (twitter, friendfeed, facebook, lastfm, etc.) pour les tâches de classification, de préférence au format arff.
Mes recherches via UCI et Google n'ont pas abouti jusqu'à présent ... des suggestions?
la source
Je viens de trouver ceci: 476 millions de tweets Twitter (via @yarapavan ).
la source
Nous avons organisé un ensemble de données Twitter pour les amis des utilisateurs en 2009 puis en 2009. Vous pouvez trouver plus d'informations ici: http://strict.dista.uninsubria.it/?p=364
la source
Consultez kaggle.com, ils organisent des concours sur les réseaux sociaux et distribuent des ensembles de données.
De plus, le SNAP de Stanford est une excellente ressource. Et il a des travaux de recherche pour démarrer.
la source
Graphique social Facebook, installations d'applications et utilisateurs, événements, groupes Last.fm sur http://odysseas.calit2.uci.edu/research/
Deux ensembles de données (collectés d'avril à mai 2009) qui contiennent des échantillons représentatifs d'environ 1 million d'utilisateurs sur l'ensemble de Facebook, avec quelques propriétés annotées: pour chaque utilisateur échantillonné, la liste d'amis, les paramètres de confidentialité et l'appartenance au réseau sont inclus. Un troisième ensemble de données (collecté en février 2008) comprend un graphique bipartite qui représente les installations d'applications par les utilisateurs de Facebook. Un quatrième ensemble de données avec des utilisateurs actifs quotidiens et des installations d'applications sur 6 mois (collecté de septembre 2007 à février 2008). Un cinquième ensemble de données qui comprend un échantillon représentatif d'utilisateurs Last.fm obtenu à l'aide d'un échantillonnage multigraphe (collecté en juillet 2010).
la source
Une bonne ressource pour trouver des jeux de données est:
/ r / jeux de données sur Reddit.
Un rapide coup d'œil sur cette page révèle cette source , qui pourrait contenir quelque chose d'utile pour vous.
la source
Ce document utilise un ensemble de données facebook qui est disponible ici. Voici la description des auteurs:
la source