J'ai des données sur le nombre d'utilisateurs qui publient le nombre de questions. Par exemple,
[UserCount, QuestionCount]
[2, 100]
[9, 10]
[3, 80]
... ...
Cela signifie que 2 utilisateurs ont chacun posté 100 questions, 9 utilisateurs ont chacun posté 10 questions, etc. Alors, comment puis-je déterminer si la UserCount, QuestionCount
distribution suit une loi de puissance?
J'ai trouvé le package poweRlaw . Cependant, je ne peux transmettre qu'un seul groupe de chiffres pour faire l'évaluation. (L'exemple fourni dans ce package est la fréquence des mots.) Alors, comment utiliser ce package? Ou ai-je quelque chose de mal? J'ai également les données du nombre de questions de chaque utilisateur, c'est-à-dire [100, 100, 10, 10, 10 ... ]
. Si je transmets ces données au package, qu'obtiendrai-je?
Réponses:
Selon Clauset et al., Voici comment vous testez la queue de la loi de puissance avec le
poweRlaw
package:les deux dernières lignes peuvent être réécrites en une seule ligne
De plus, à ce stade, vous pouvez voir la statistique KS:
Cela pourrait prendre un certain temps, alors allez prendre une tasse de thé ...
poweRlaw
compare_distributions
comp
comp$test_statistic
data_pl
comp$p_two_side
Répétez cette étape avec
disexp
,dispois
classes pour comparer la loi de puissance avec ces alternatives.la source
data("moby")
et utiliser à lamoby
place dedata
dans mon exemple, comme dans l'introduction