J'analyse les réseaux sociaux (non virtuels) et j'observe les liens entre les gens. Si une personne choisissait une autre personne pour se connecter au hasard, le nombre de connexions au sein d'un groupe de personnes serait réparti normalement - au moins selon le livre que je lis actuellement.
Comment savoir si la distribution est gaussienne (normale)? Il existe d'autres distributions telles que Poisson, Rice, Rayliegh, etc. Le problème avec la distribution gaussienne en théorie est que les valeurs vont de à (bien que les probabilités vont vers zéro) et le nombre de connexions ne peut pas être négatif .
Est-ce que quelqu'un sait à quelle distribution on peut s'attendre au cas où chaque personne choisirait (au hasard) une autre personne avec qui se connecter?
Réponses:
Lorsqu'il y a personnes et que le nombre de connexions établies par la personne i , 1 ≤ i ≤ n , est X i , alors le nombre total de connexions est S n = ∑ n i = 1 X i / 2 . Maintenant, si nous prenons le X in i,1≤i≤n, Xi Sn=∑ni=1Xi/2 Xi comme des variables aléatoires, supposons qu'elles sont indépendantes et que leurs variances ne sont pas "trop inégales" à mesure que de plus en plus de personnes sont ajoutées au mélange, alors le théorème de limite centrale de Lindeberg-Levy s'applique. Il affirme que la fonction de distribution cumulativede la somme standardisée converge vers le cdf de la distribution normale. Cela signifie à peu près qu'un histogramme de la somme ressemblera de plus en plus à un gaussien (une "courbe en cloche") à mesure que grandit.n
Passons en revue ce que cela ne dit pas :
Elle n'affirme pas que la distribution de soit jamais exactement normale. Cela ne peut pas être le cas, pour les raisons que vous mentionnez.Sn
Cela n'implique pas que le nombre attendu de connexions converge. En fait, il doit diverger (aller à l'infini). La standardisation est un recentrage et un redimensionnement de la distribution; la quantité de rééchelonnement augmente sans limite.
Il ne dit rien lorsque les ne sont pas indépendants ou lorsque leurs variances changent trop à mesure que n croît. (Cependant, il existe des généralisations du CLT pour des séries de variables "légèrement" dépendantes.)Xi n
la source
La réponse dépend des hypothèses que vous êtes prêt à faire. Un réseau social évolue constamment au fil du temps et n'est donc pas une entité statique. Par conséquent, vous devez faire quelques hypothèses sur la façon dont le réseau évolue au fil du temps.
Si une personne sélectionne une autre personne au hasard pour se connecter, tout le monde sera finalement connecté.
Cependant, les réseaux réels ne se comportent pas de cette façon. Les gens diffèrent sur plusieurs aspects.
À tout moment, une personne a une taille de réseau fixe et la probabilité qu'une autre connexion soit établie est fonction de la taille de son réseau (car les gens présentent d'autres personnes, etc.).
Une personne a sa propre tendance intrinsèque à former une connexion (comme certains sont introvertis / exterovert, etc.).
Ces probabilités changent avec le temps, le contexte, etc. Je ne suis pas sûr qu'il y ait une réponse simple à moins que nous formulions des hypothèses sur la structure du réseau (par exemple, la densité du réseau, comment les gens se comportent, etc.).
la source