Je pense que la médiane moyenne.
Est-ce le cas?
distributions
self-study
mean
skewness
median
Kunjan Kshetri
la source
la source
Réponses:
C'est une question non triviale (sûrement pas aussi triviale que les personnes qui posent la question semblent le penser).
La difficulté est finalement causée par le fait que nous ne savons pas vraiment ce que nous entendons par «asymétrie» - la plupart du temps, c'est assez évident, mais parfois ce n'est vraiment pas le cas. Étant donné la difficulté à cerner ce que nous entendons par «emplacement» et «propagation» dans les cas non triviaux (par exemple, la moyenne n'est pas toujours ce que nous entendons lorsque nous parlons de l'emplacement), il ne devrait pas être très surprenant qu'un plus subtil concept comme l'asymétrie est au moins aussi glissant. Cela nous amène donc à essayer différentes définitions algébriques de ce que nous voulons dire, et elles ne sont pas toujours d'accord les unes avec les autres.
1) Si vous mesurez l'asymétrie par le deuxième coefficient d'asymétrie Pearson , alors la moyenne ( ) sera inférieure à la médiane ( ∼ μ - c'est-à-dire que dans ce cas, vous l'avez à l'envers).μ μ∼
La deuxième asymétrie de Pearson (population) est de et sera négatif ("biais gauche") lorsque μ < ∼ μ .
Les exemples de versions de ces statistiques fonctionnent de manière similaire.
La raison de la relation nécessaire entre la moyenne et la médiane dans ce cas est que c'est ainsi que la mesure d'asymétrie est définie.
Voici une densité asymétrique à gauche (à la fois par la deuxième mesure de Pearson et la mesure la plus courante dans (2) ci-dessous):
La médiane est marquée dans la marge inférieure en vert, la moyenne en rouge.
Je m'attends donc à ce que la réponse qu'ils veulent que vous donniez est que la moyenne est inférieure à la médiane. C'est généralement le cas avec les types de distributions auxquels nous avons tendance à donner des noms.
(Mais lisez la suite et voyez pourquoi ce n'est pas vraiment correct en tant qu'énoncé général.)
2) Si vous le mesurez au troisième moment standardisé le plus habituel , il est souvent, mais pas toujours, le cas où la moyenne sera inférieure à la médiane.
Autrement dit, il est possible de construire des exemples où l'inverse est vrai, ou où une mesure d'asymétrie est nulle tandis que l'autre est non nulle.
Autrement dit, il n'y a pas de relation nécessaire entre les emplacements de la moyenne, de la médiane et de l'asymétrie du moment.
Considérons, par exemple, l'échantillon suivant (le même exemple peut être construit comme une distribution de probabilité discrète):
Pourtant, le coefficient d'asymétrie (Fisher, troisième moment) est négatif (c'est-à-dire par ses lumières, nous avons des données d'asymétrie gauche) car la somme des cubes des écarts par rapport à la moyenne est négative.
Donc, dans ce cas, gauche-biais, mais moyenne> médiane.
(D'un autre côté, si vous changez 2,7 dans l'exemple ci-dessus en 3, alors vous avez un exemple où le moment-asymétrie est nul, mais la moyenne dépasse la médiane. Si vous le faites 3,3, alors le moment-asymétrie est positif , et la moyenne dépasse la médiane - c'est-à-dire qu'elle est finalement dans la direction «anticipée».)
Si vous utilisez la première asymétrie Pearson au lieu de l'une des définitions ci-dessus, vous avez un problème similaire à ce cas - la direction de l'asymétrie ne définit pas la relation entre la moyenne et la médiane en général.
Edit: en réponse à une question dans les commentaires - un exemple où la moyenne et la médiane sont égales, mais l'inclinaison du moment est négative. Considérez les données suivantes (comme précédemment, elles comptent également comme exemple pour une population discrète; pensez à écrire les nombres sur les faces d'un dé).
la moyenne et la médiane sont toutes les deux de 6, mais la somme des cubes d'écarts par rapport à la moyenne est négative, de sorte que l'asymétrie du troisième moment est négative.
la source
Non. Les données asymétriques à gauche ont une longue queue à gauche (extrémité inférieure), de sorte que la moyenne sera généralement inférieure à la médiane. (Mais voir la réponse de @Glen_b pour une exception). Mine de rien, je pense que les données qui «semblent» faussées à gauche auront une signification inférieure à la médiane.
Les données asymétriques à droite sont plus courantes; par exemple, le revenu. Là, la moyenne est supérieure à la médiane.
Code R
la source