Dans certaines études de marché, les consommateurs sont invités à classer les caractéristiques d'un produit en fonction de leur priorité. Par exemple,
Classez les fonctionnalités suivantes pour un appareil en fonction de votre priorité (1 étant la priorité la plus élevée)
Storage capacity 6
Portability 5
Touch interface 1
Keyboard 4
Long battery life 2
Entertainment on the go 3
Sur une échelle de 1 à 5, évaluez les caractéristiques en fonction de leur importance (1 étant très important)
1 2 3 4 5
Storage capacity 1
Portability 3
Touch interface 1
Keyboard 1
Long battery life 2
Entertainment on the go 4
Maintenant, sur la base du classement et de la notation, je veux attribuer des poids et à la fin savoir si le consommateur préfère un ordinateur portable ou une tablette PC /
Disons que dans cet exemple, le consommateur a classé le toucher à 1 et l'autonomie de la batterie à 2; ce sont les attributs d'une tablette. Mais il a classé le clavier et la capacité de stockage comme les plus importants, qui sont les caractéristiques d'un ordinateur portable avec un clavier.
Comment puis-je combiner ces deux et probablement attribuer des poids et arriver à un score? Si le score est supérieur à un certain niveau, le consommateur préfère une tablette et en dessous d'un certain niveau, le consommateur préfère un ordinateur portable.
la source
Réponses:
Je suppose que vous ne pouvez pas simplement leur demander s'ils préfèrent un ordinateur portable ou une tablette; ou vous voulez vérifier ce qu'ils pensent qu'ils préfèrent avec ce que vous pensez qu'ils devraient préférer ...
Il y a un certain nombre de façons de le faire. Il s'agit en fait d'une version du problème réel très courant de l'évaluation des candidats à un emploi ou des offres de passation de marchés - vous devez décider des critères, les pondérer et évaluer les candidats en fonction des critères. Vous avez souligné le problème de la pondération des critères, mais la notation des candidats (ordinateur portable et tablette) par rapport aux critères est cruciale, tout comme le choix des six critères en premier lieu. Ce sont en grande partie des jugements plutôt que des questions statistiques.
Deux étapes sont nécessaires: combiner les informations des deux questions pour vous donner des pondérations pour les critères; et comparer l'importance accordée aux six qualités à la performance des deux produits par rapport à ces six qualités.
Votre premier problème est que vous avez deux questions qui semblent (voir mon commentaire) obtenir essentiellement le même facteur sous-jacent et que les répondants ne seront inévitablement pas complètement cohérents dans leurs réponses (bien que, espérons-le, pas autant que dans votre exemple, où la capacité de stockage est la priorité la plus basse mais "très importante"!)
Une approche pour combiner ces deux est de convertir le classement en une note sur la même échelle que la deuxième question, puis de prendre une moyenne. Vous pouvez le faire par exemple par .r a ten e w=r a t e + r a n k ∗45+ 0,22
C'est un peu grossier, mais le fait est qu'il n'y a pas de moyen vraiment satisfaisant de combiner les deux sans inconvénients d'aucune sorte. La conversion des classements en notes et vice versa est un problème, quelle que soit la façon dont vous le faites, et une sorte de règle de base est nécessaire pour gérer les liens dans les notes (si vous voulez les transformer en classements) ou une plage inconnue derrière les classements (si vous veulent les transformer en notes, c'est-à-dire que l'utilisateur a été forcé de classer de 1 à 6, mais pourrait vraiment penser qu'ils sont tous vraiment importants - ou sans importance ...).
La prochaine crudité est que vous devrez évaluer les produits en fonction des six qualités. Souvent, on aurait demandé aux sujets de le faire, mais dans ce cas, il semble que vous devez le faire vous-même. Vous produirez une matrice comme:
Je suis resté fidèle à la convention que vous avez selon laquelle les scores faibles sont bons.
Ensuite, vous multipliez et additionnez vos notes d'importance par ces scores de qualité et vous obtenez un score pour tablette et un pour ordinateur portable. Celui avec le score le plus bas est la préférence - vous n'avez pas besoin d'un seuil, juste pour comparer les deux scores.
Notez que la façon dont vous notez les deux produits par rapport aux six qualités sera cruciale à cet égard - probablement plus importante que la façon dont vous avez généré les pondérations. Vous devriez donc essayer une gamme de scores différents et voir ceux qui donnent des résultats plausibles. Il n'y a aucun moyen statistique d'obtenir les «bons» scores, avec les informations dont vous disposez. Si vous connaissiez les préférences réelles des ordinateurs portables / tables des gens, vous pourriez peut-être générer un ensemble de scores qui produiraient ces préférences, mais alors tout l'exercice serait différent.
Voir ci-dessous pour un code R et une sortie qui implémente cela et suggère que votre sujet quelque peu confus pourrait en fait vouloir un ordinateur portable:
la source
Penser que vous pouvez apprendre ce qui est important dans les décisions des gens simplement en demandant exprime un optimisme injustifié. Mais il existe de bonnes méthodes pour "dériver" l'importance de différents facteurs. Des années et des années de recherche en psychologie et en économie comportementale l'ont confirmé. Un collègue et moi avons résumé quelques résultats de la littérature sur ce sujet et exploré quelques façons de les appliquer (dans un contexte d'enseignement supérieur) ici .
la source
Il s'agit d'une tâche d'apprentissage non supervisée. Voici une idée très simple qui, si elle est incorrecte, j'espère que quelqu'un d'autre le soulignera. Alimentez vos dix variables dans une PCA pour extraire 2 PC. Utilisez les deux composants principaux d'un algorithme de clustering à 2 moyennes pour définir les limites de l'affectation à chacun des deux groupes. Examinez les PC et nommez-les Tablet et Laptop si cela est logique de le faire. Vous avez maintenant un critère basé sur une combinaison linéaire de vos 10 variables.
Le principal problème que je vois avec cela est que vous ne vous retrouverez pas nécessairement avec un algorithme de prédiction "ordinateur portable" contre "tablette" défini. Pour obtenir quelque chose comme ça, vous devriez idéalement avoir au moins quelques points de données avec des résultats sur lesquels vous entraîner.
la source