Intuition et utilisations du coefficient de variation

11

Je participe actuellement au cours An Introduction to Operations Management sur Coursera.org. À un moment donné du cours, le professeur a commencé à faire face à la variation du temps des opérations.

La mesure qu'il utilise est le coefficient de variation , le rapport entre l'écart-type et la moyenne:

cv=σμ

Pourquoi cette mesure serait-elle utilisée? Quels sont les avantages et les inconvénients de travailler avec CV en plus de travailler avec, par exemple, l'écart-type? Quelle est l'intuition derrière cette mesure?

Lucas Reis
la source

Réponses:

8

Je pense que c'est une mesure relative de la propagation ou de la variabilité des données. Si vous pensez à l'énoncé «L'écart type est de 2,4», il ne vous dit vraiment rien sans respecter la moyenne (et donc l'unité de mesure, je suppose). Si la moyenne est égale à 104, l'écart-type de 2,4 communique une image de l'écart assez différente que si la moyenne était de 25 452 avec un écart-type de 2,4.

La même raison pour laquelle vous normalisez les données (soustrayez la moyenne et divisez par l'écart-type) pour placer les données exprimées dans différentes unités sur un pied d'égalité ou de comparaison - de même cette mesure de la variabilité est normalisée - pour faciliter les comparaisons.

B_Miner
la source
2

Le coefficient de variation est effectivement une mesure normalisée ou relative de la variation dans un ensemble de données (par exemple une série chronologique) en ce qu'il s'agit d'une proportion (et peut donc être exprimée en pourcentage). Intuitivement, si la moyenne est la valeur attendue, alors le coefficient de variation est la variabilité attendue d'une mesure, par rapport à la moyenne.

Ceci est utile lors de la comparaison de mesures entre plusieurs ensembles de données hétérogènes ou entre plusieurs mesures prises sur le même ensemble de données - le coefficient de variation entre deux ensembles de données, ou calculé pour deux ensembles de mesures peut être directement comparé, même si les données de chacun sont mesurées à des échelles, des taux d'échantillonnage ou des résolutions très différents. En revanche, l'écart type est spécifique à la mesure / à l'échantillon à partir duquel il est obtenu, c'est-à-dire qu'il s'agit d'une mesure de variation absolue plutôt que relative.

BGreene
la source
Pouvez-vous expliquer plus en détail cette partie: "Le coefficient de variation est la variabilité attendue d'une mesure sur un intervalle"?
B_Miner
@B_Miner Je voulais dire intervalle au sens du traitement du signal et j'ai édité ci-dessus. Std dev est effectivement la variation moyenne ou attendue.
BGreene
-2

selon ma compréhension, la moyenne est le paramètre de localisation. sd / moyenne ne doit pas être considéré comme un coefficient de variation. Pourquoi? l'argument simple est que la distance statistique est différente de la distance euclidienne. pour mesurer la distance statistique, nous utilisons sd; distance brute pour une variable. supposons que 50 est moyen et 2 est sd, alors 4% seront cv. maintenant la moyenne est 5 et sd est 2 cv = 40%. le terme de variation statistique est indépendant de l'origine. donc sd lui-même est une bonne mesure de la variation. et rappelez-vous une règle de la physique qui est de ne pas comparer deux systèmes unitaires en un seul problème.

devendra tandle
la source
2
Il est difficile de voir ici un argument cohérent. Ne faut-il pas considérer sd / mean comme le coefficient de variation? Voilà comment c'est défini. Si vous voulez dire que ce n'est pas utile, expliquez pourquoi. (Si vous pensez qu'il est mal nommé, c'est une autre histoire.) La distance statistique diffère de la distance euclidienne? Ce n'est qu'une affirmation et dépend de savoir ce que vous entendez par distance statistique. Comme de nombreux types de distance apparaissent dans les statistiques, l'assertion reste obscure. (Je n'ai pas downvote, mais je vous exhorte à réécrire ceci. Vous devrez peut-être travailler avec un ami avec une meilleure maîtrise de l'anglais écrit.)
Nick Cox