En supposant que je puisse télécharger à partir de Facebook une liste de mes amis, et lesquels sont amis entre eux - puis-je estimer à partir de ces informations lequel d'entre eux est "central"? (Je ne sais pas exactement comment définir ce qu'est "central" dans ce contexte)
Quelles informations / hypothèses sont nécessaires?
Merci.
descriptive-statistics
networks
social-network
Tal Galili
la source
la source
Réponses:
La solution la plus simple serait de compter le nombre d'amis que chacun de vos amis a en commun avec vous, de l'inverser et de l'utiliser comme mesure de centralité.
Tout autre élément nécessitera nécessairement des hypothèses supplémentaires: vous pouvez toujours additionner les distances (le long du chemin de l'ami le plus court à l'exception de vous) entre tous vos amis (et celui avec la plus petite "distance totale" serait alors "le plus central"). Mais ensuite, vous devez décider: quel est le "poids" des plus longues distances: supposons que vous considérez la distance entre A et B et les personnes C, D et E, et ce sont respectivement 3,1,2 et 4,1, 1: considérez-vous la même distance totale?
De plus, si vous voulez éviter les personnes totalement déconnectées (ce qui rend la somme difficile, car vous devez spécifier un nombre fixe pour les distances des personnes "déconnectées"), vous devrez probablement autoriser les connexions en dehors de votre propre cercle d'amis (par exemple: vous sont amis avec 100 personnes qui me connaissent, mais vous ne vous liez pas d'amitié avec moi, et les 100 personnes ne sont pas nécessairement amies non plus). Mais même alors, vous pouvez avoir des nœuds déconnectés dans votre "graphique ami".
Enfin, vous devrez peut-être aussi peser les connexions elles-mêmes: peut-être la date à laquelle l'amitié a été établie, peut-être le nombre de messages qui ont été affichés sur le mur de l'un ou l'autre (ce qui pourrait même rendre la "distance" non symétrique), la personne qui a initié l'amitié (envoyé la "demande"), ou les détails spécifiés sur la relation (relations familiales, etc.) pourraient avoir une incidence sur votre "distance d'intérêt".
Dans l'ensemble: vous devrez préciser quels sont vos objectifs et y adapter votre mesure de distance. Il y a forcément beaucoup de littérature sur les distances dans les graphiques, mais toutes nécessiteront de déterminer la distance qui vous intéresse.
la source
Il existe de nombreuses façons de définir vos amis "les plus centraux". Ces mesures sont appelées mesures de centralité. Probablement les trois plus courants sont ceux-ci, avec des explications en anglais un peu simples.
Parfois, ils sont très similaires et mettent en évidence les mêmes personnes «importantes». Parfois, ils donnent des résultats intéressants où même quelqu'un sans un grand nombre de connexions est un "ami d'un ami" de presque tout le monde, ou relie deux groupes disparates. Et ce ne sont que quelques-unes - comme je l'ai dit, il y a une tonne de façons différentes de considérer la centralité, avec beaucoup de rebondissements.
De nombreux logiciels vous permettront d'examiner ces mesures. Mon favori personnel, si vous connaissez Python, est NetworkX. NodeXL fonctionne pour Excel, sna est l'un des packages R qui le gère, etc.
En termes d'informations dont vous avez besoin ... évidemment, vous avez besoin du réseau lui-même. Une chose que vous supposez est que le réseau que vous collectez (dans ce cas, Facebook), représente adéquatement le réseau d'amitié réel dont vous parlez. Ainsi, par exemple, les gens n'ont pas de cintres dans la liste de leurs amis qu'ils n'ont pas pris la peine de supprimer, ou il n'y a personne qui est important pour votre réseau qui se soit désengagé des réseaux sociaux. Ou dans le cas de Facebook, qu'il n'y a pas de comptes d'usurpation d'identité.
la source
Jetez un œil à NodeXL (une extension Excel simple mais puissante pour l'analyse de réseau) et au livre Analyse des réseaux de médias sociaux avec NodeXL: Insights from a Connected World. Même si vous utiliserez un autre logiciel, le livre traite très bien des différentes mesures de centralité et de leurs utilisations. Je ne l'ai pas devant moi, mais je semble me souvenir qu'il répond à la question de la priorité dans le contexte du marketing.
la source