Comment évaluer l'écart type?

15

J'ai recueilli les réponses de 85 personnes sur leur capacité à entreprendre certaines tâches.

Les réponses sont sur une échelle de Likert à cinq points:

5 = Très bien, 4 = Bon, 3 = Moyen, 2 = Mauvais, 1 = Très pauvre,

Le score moyen est de 2,8 et l'écart-type est de 0,54.

Je comprends ce que représentent la moyenne et l'écart-type.

Ma question est: à quel point cet écart type est-il bon (ou mauvais)?

En d'autres termes, existe-t-il des lignes directrices pouvant aider à évaluer l'écart type.

Amarald
la source
Qu'est-ce que cela signifierait pour le SD d'être bon ou mauvais ici?
gung - Rétablir Monica
7
Il est assez difficile d'obtenir une si petite SD avec des données comme celle-ci: pour une moyenne de 2,8, la SD doit être au moins . (Même si 2,8 représente une valeur arrondie, l'écart-type doit toujours dépasser 0,357.) Un écart-type de 0,54 implique que pas plus de deux personnes auraient pu répondre avec un 5 (avec 21 2 et 62 3) et pas plus de six auraient pu répondre avec un 1 (avec 5 2 et 74 3). Cela suggère que la question peut fournir exceptionnellement peu d'informations car l'échelle ne fait pas de discrimination effective. 0,2×0,8=0,4
whuber
@whuber excellentes analyses de données! Mais je pouvais aussi imaginer qu'il soit en moyenne sur différentes questions ou qu'il avait fait quelque chose de mal dans ses calculs. Il semble difficile d'imaginer que les gens aient vraiment répondu de manière aussi uniforme, surtout lorsqu'ils parlaient de leurs capacités supposées.
Erik

Réponses:

17

Les écarts-types ne sont ni «bons» ni «mauvais». Ce sont des indicateurs de la répartition de vos données. Parfois, dans les échelles de notation, nous voulons une large diffusion car cela indique que nos questions / notations couvrent la gamme du groupe que nous notons. D'autres fois, nous voulons un petit sd parce que nous voulons que tout le monde soit "haut".

3+2

Donc. Quel est le but de votre test? Qui fait partie de l'échantillon?

Peter Flom - Réintégrer Monica
la source
2
(+1) Juste pour ajouter un peu à la remarque "Les écarts-types ne sont pas" bons "ou" mauvais "" - avoir un prédicteur avec un grand écart-type peut être "bon" car, en régression, il est inversement lié au standard erreur d'une estimation du coefficient de régression. D'un autre côté, si vous vous souciez de la précision d'une mesure, un écart-type important est "mauvais". Je suppose que l'intérêt de l'affiche originale est plus proche du premier, mais ce n'est pas clair.
Macro
10

Réponse courte, c'est bien et un peu plus bas que ce à quoi je m'attendais des données d'enquête. Mais probablement, l'histoire de votre entreprise se situe davantage dans la moyenne ou dans le top 2.

Pour des échelles discrètes issues de la recherche en sciences sociales, dans la pratique, l'écart type est une fonction directe de la moyenne. En particulier, j'ai trouvé grâce à l'analyse empirique de nombreuses études de ce type que l'écart type réel dans les enquêtes sur des échelles à 5 points est de 40% à 60% de la variation maximale possible (hélas non documentée ici).

Au niveau le plus simple, considérez les extrêmes, imaginez que la moyenne était de 5,0. L'écart type doit être nul, car la seule façon de faire la moyenne de 5 est que tout le monde réponde 5. Inversement, si la moyenne était de 1,0, l'erreur standard doit également être égale à 0. L'écart type est donc défini avec précision compte tenu de la moyenne.

Maintenant, entre les deux, il y a plus de zone grise. Imaginez que les gens puissent répondre soit 5.0 ou 1.0 mais rien entre les deux. L'écart type est alors une fonction précise de la moyenne:

stdev = sqrt ((5-moyenne) * (moyenne-1))

L'écart type maximal pour les réponses sur n'importe quelle échelle bornée est la moitié de la largeur de l'échelle. Ici, c'est sqrt ((5-3) (3-1)) = sqrt (2 * 2) = 2.

Maintenant, bien sûr, les gens peuvent répondre à des valeurs intermédiaires. D'après les métastudes des données d'enquête dans notre entreprise, je trouve que l'écart type pour les échelles numériques dans la pratique est de 40% à 60% du maximum. Plus précisément

  • 40% pour des échelles de points à 100%,
  • 50% pour les échelles à 10 points et
  • 60% pour les échelles à 5 points et
  • 100% pour les échelles binaires

Donc, pour votre jeu de données, je m'attends à un écart-type de 60% x 2,0 = 1,2. Vous avez obtenu 0,54, ce qui représente environ la moitié de ce à quoi je m'attendais si les résultats avaient été des notes explicites. Les évaluations des compétences sont-elles le résultat de batteries de tests plus compliquées qui sont des moyennes et auraient donc une variance plus faible?

La vraie histoire, cependant, est probablement que la capacité est si faible ou si élevée par rapport à d'autres tâches. Indiquez les moyennes ou les pourcentages les plus élevés entre les compétences et concentrez votre analyse sur cela.

prototype
la source
-1

Si les données sont normalement distribuées, vous pouvez voir comment se situe la population.

  • 68% de toutes les personnes se trouvent à moins d'un écart-type de la moyenne (2.26 - 3.34 ):

entrez la description de l'image ici

  • 95% de toutes les personnes se situent à moins de 2 écarts-types de la moyenne (1.72 - 3.88 ):

entrez la description de l'image ici

Il vous indique à quel point vos chiffres sont "étalés".

Ian Boyd
la source
1
Cette réponse n'a pas été votée car elle est incorrecte: elle utilise une règle empirique approximative (comme si elle était exacte) dans le cas où elle est inapplicable. La réponse serait vraie si elle était remplacée par les conclusions de l'inégalité de Chebyshev (qui déclare qu'au moins 75% des observations se situent dans les deux écarts-types de l'observation moyenne; c'est-à-dire qu'au moins 75% des réponses sont des 2 ou des 3), mais cela ne fournira pas beaucoup d'informations.
whuber
De plus, cela n'est vrai que pour les populations vraiment normalement réparties. À partir de là, vous pouvez calculer les nombres de manière arbitraire exactement en évaluant l'intégrale sur le pdf normal avec les limites données par le sd autour de la moyenne. Vraiment pas utile ici.
Douba