J'ai une base de données contenant un grand nombre d'experts dans un domaine. Pour chacun de ces experts, j'ai une variété d'attributs / points de données comme:
- nombre d'années d'expérience.
- licences
- nombre d'avis
- contenu textuel de ces avis
- Les 5 étoiles sur chacun de ces avis, pour un certain nombre de facteurs comme la vitesse, la qualité, etc.
- prix, assosciations, conférences etc.
Je veux attribuer une note à ces experts sur 10 en fonction de leur importance. Certains points de données pourraient manquer pour certains experts. Maintenant, ma question est de savoir comment puis-je trouver un tel algorithme? Quelqu'un peut-il m'indiquer une littérature pertinente?
Je suis également préoccupé par le fait que, comme pour toutes les notes / avis, les chiffres pourraient se rapprocher de certaines valeurs. Par exemple, la plupart d'entre eux pourraient finir par obtenir un 8 ou un 5. Existe-t-il un moyen de mettre en évidence de petites différences en une plus grande différence de score pour seulement certains des attributs.
Quelques autres discussions que je pensais pourraient être pertinentes:
Réponses:
Les gens ont inventé de nombreux systèmes pour évaluer les choses (comme les experts) sur plusieurs critères: visitez la page Wikipedia sur l' analyse de décision multicritères pour une liste. Cependant, il n'est pas bien représenté là-bas, l'une des méthodes les plus défendables: la théorie de l'évaluation multi-attributs. Cela comprend un ensemble de méthodes pour évaluer les compromis entre des ensembles de critères afin de (a) déterminer un moyen approprié de ré-exprimer les valeurs des variables individuelles et (b) pondérer les valeurs ré-exprimées pour obtenir un score pour le classement . Les principes sont simples et défendables, les mathématiques sont irréprochables, et la théorie n'a rien d'extraordinaire. Plus de gens devraient connaître et pratiquer ces méthodes plutôt que d'inventer des systèmes de notation arbitraires.
la source
En fin de compte, cela peut ne pas être uniquement un exercice statistique. PCA est une méthode quantitative très puissante qui vous permettra de générer un score ou des pondérations sur ses premiers composants principaux que vous pouvez utiliser pour le classement. Cependant, il est très difficile d'expliquer quels sont les principaux composants. Ce sont des constructions quantitatives. Ce ne sont pas des dialectes. Ainsi, expliquer ce qu'ils signifient vraiment n'est parfois pas possible. Cela est particulièrement vrai si vous avez un public qui n'est pas quantitatif. Ils n'auront aucune idée de quoi vous parlez. Et, considérera votre PCA comme une boîte noire cryptique.
Au lieu de cela, je voudrais simplement aligner toutes les variables pertinentes et utiliser un système de pondération basé sur ce que l'on pense que la pondération devrait être.
Je pense que si vous développez cela pour des étrangers, des clients, des utilisateurs, ce serait formidable si vous pouviez intégrer la flexibilité de décider de la pondération aux utilisateurs.
Certains utilisateurs peuvent apprécier des années d'expérience bien plus que la certification et les versets. Si vous pouvez leur laisser cette décision. De cette façon, votre algorithme n'est pas une boîte noire qu'ils ne comprennent pas et avec laquelle ils ne sont pas à l'aise. Vous le gardez totalement transparent et dépend d'eux en fonction de leur propre évaluation relative de ce qui compte.
la source
Pensez-vous que vous pourriez quantifier tous ces attributs?
Si oui, je suggère d'effectuer une analyse en composantes principales. Dans le cas général où toutes les corrélations sont positives (et si elles ne le sont pas, vous pouvez facilement y arriver en utilisant une certaine transformation), le premier composant principal peut être considéré comme une mesure de l'importance totale de l'expert, car c'est une pondération moyenne de tous les attributs (et les poids seraient les contributions correspondantes des variables - Dans cette perspective, la méthode elle-même révélera l'importance de chaque attribut). Le score que chaque expert obtient dans le premier composant principal est ce dont vous avez besoin pour les classer.
la source