Merci d'avance de m'avoir accompagné, je ne suis aucun statisticien et je ne sais pas comment décrire ce que j'imagine, donc Google ne m'aide pas ici ...
J'inclus un système de notation dans une application Web sur laquelle je travaille. Chaque utilisateur peut évaluer chaque élément exactement une fois.
J'imaginais une échelle avec 4 valeurs: "n'aime pas du tout", "n'aime pas", "aime" et "fortement aime", et j'avais prévu d'attribuer ces valeurs de -5, -2, +2 et +5 respectivement .
Maintenant, si chaque article devait avoir le même nombre de notes, je serais assez à l'aise avec ce système de notation qui différencie clairement les articles les plus aimés et les moins aimés. Cependant, les articles n'auront pas le même nombre de notes et la disparité entre le nombre de votes sur différentes photos peut être assez dramatique.
Dans ce cas, la comparaison des scores cumulés sur deux éléments signifie qu'un ancien élément avec beaucoup de notes médiocres aura un score beaucoup plus élevé qu'un nouvel élément exceptionnel avec beaucoup moins de votes.
Donc, la première chose évidente à laquelle j'ai pensé que nous prenions une moyenne ... mais maintenant, si un article n'a qu'une seule note de "+5", il a une meilleure moyenne qu'un article qui a un score de 99 "+5". et 1 "+2". Intuitivement, ce n'est pas une représentation précise de la popularité d'un article.
J'imagine que ce problème est courant et vous n'avez pas besoin de moi pour le développer avec plus d'exemples, alors je m'arrêterai à ce stade et j'élaborerai dans les commentaires si nécessaire.
Mes questions sont:
- Comment s'appelle ce type de problème et existe-t-il un terme pour les techniques utilisées pour le résoudre? J'aimerais le savoir pour pouvoir le lire.
- Si vous connaissez des ressources conviviales sur le sujet, j'apprécierais beaucoup un lien.
- Enfin, j'apprécierais toute autre suggestion sur la manière de collecter et d'analyser efficacement ce type de données.
Je prendrais une approche graphique. L'axe des x pourrait être une note moyenne et le y pourrait être le nombre de notes. J'avais l'habitude de le faire avec des statistiques sportives pour comparer la contribution des jeunes phénomènes à celle des stars vétérans. Plus un point est proche du coin supérieur droit, plus l'idéal est proche. Bien sûr, décider du «meilleur» élément serait toujours une décision subjective, mais cela fournirait une certaine structure.
Si vous souhaitez tracer la note moyenne par rapport à une autre variable, vous pouvez configurer le nombre de notes comme troisième variable en utilisant la taille des bulles, dans un graphique à bulles - par exemple, en XL ou SAS.
la source