Dans les données asymétriques de gauche, quelle est la relation entre la moyenne et la médiane?

12

Je pense que la médiane moyenne.

Est-ce le cas?

Kunjan Kshetri
la source
2
De quel cours MOOC ouvert s'agit-il? Qu'est-ce que le matériel de cours suggère que la réponse devrait être?
Glen_b -Reinstate Monica
1
class.stanford.edu/courses/Medicine/HRP258/… . Le cours est terminé.
Kunjan Kshetri
1
Merci, c'est un peu du contexte, bien qu'il ne reste que des lectures hebdomadaires qui n'apportent pas beaucoup de lumière sur cette question. Je me demande ce que le cours avait à dire sur le sujet.
Glen_b -Reinstate Monica

Réponses:

16

C'est une question non triviale (sûrement pas aussi triviale que les personnes qui posent la question semblent le penser).

La difficulté est finalement causée par le fait que nous ne savons pas vraiment ce que nous entendons par «asymétrie» - la plupart du temps, c'est assez évident, mais parfois ce n'est vraiment pas le cas. Étant donné la difficulté à cerner ce que nous entendons par «emplacement» et «propagation» dans les cas non triviaux (par exemple, la moyenne n'est pas toujours ce que nous entendons lorsque nous parlons de l'emplacement), il ne devrait pas être très surprenant qu'un plus subtil concept comme l'asymétrie est au moins aussi glissant. Cela nous amène donc à essayer différentes définitions algébriques de ce que nous voulons dire, et elles ne sont pas toujours d'accord les unes avec les autres.

1) Si vous mesurez l'asymétrie par le deuxième coefficient d'asymétrie Pearson , alors la moyenne ( ) sera inférieure à la médiane ( μ - c'est-à-dire que dans ce cas, vous l'avez à l'envers).μμ

La deuxième asymétrie de Pearson (population) est de et sera négatif ("biais gauche") lorsque μ < μ .

3(μμ)σ,
μ<μ

Les exemples de versions de ces statistiques fonctionnent de manière similaire.

La raison de la relation nécessaire entre la moyenne et la médiane dans ce cas est que c'est ainsi que la mesure d'asymétrie est définie.

Voici une densité asymétrique à gauche (à la fois par la deuxième mesure de Pearson et la mesure la plus courante dans (2) ci-dessous):

entrez la description de l'image ici

La médiane est marquée dans la marge inférieure en vert, la moyenne en rouge.

Je m'attends donc à ce que la réponse qu'ils veulent que vous donniez est que la moyenne est inférieure à la médiane. C'est généralement le cas avec les types de distributions auxquels nous avons tendance à donner des noms.

(Mais lisez la suite et voyez pourquoi ce n'est pas vraiment correct en tant qu'énoncé général.)


2) Si vous le mesurez au troisième moment standardisé le plus habituel , il est souvent, mais pas toujours, le cas où la moyenne sera inférieure à la médiane.

Autrement dit, il est possible de construire des exemples où l'inverse est vrai, ou où une mesure d'asymétrie est nulle tandis que l'autre est non nulle.

Autrement dit, il n'y a pas de relation nécessaire entre les emplacements de la moyenne, de la médiane et de l'asymétrie du moment.

Considérons, par exemple, l'échantillon suivant (le même exemple peut être construit comme une distribution de probabilité discrète):

  2.7 15.0 15.0 15.0 30.0 30.0

mean: 17.95
median: 15

Pourtant, le coefficient d'asymétrie (Fisher, troisième moment) est négatif (c'est-à-dire par ses lumières, nous avons des données d'asymétrie gauche) car la somme des cubes des écarts par rapport à la moyenne est négative.

Donc, dans ce cas, gauche-biais, mais moyenne> médiane.

(D'un autre côté, si vous changez 2,7 dans l'exemple ci-dessus en 3, alors vous avez un exemple où le moment-asymétrie est nul, mais la moyenne dépasse la médiane. Si vous le faites 3,3, alors le moment-asymétrie est positif , et la moyenne dépasse la médiane - c'est-à-dire qu'elle est finalement dans la direction «anticipée».)

Si vous utilisez la première asymétrie Pearson au lieu de l'une des définitions ci-dessus, vous avez un problème similaire à ce cas - la direction de l'asymétrie ne définit pas la relation entre la moyenne et la médiane en général.


Edit: en réponse à une question dans les commentaires - un exemple où la moyenne et la médiane sont égales, mais l'inclinaison du moment est négative. Considérez les données suivantes (comme précédemment, elles comptent également comme exemple pour une population discrète; pensez à écrire les nombres sur les faces d'un dé).

 1  5  6  6  8 10

la moyenne et la médiane sont toutes les deux de 6, mais la somme des cubes d'écarts par rapport à la moyenne est négative, de sorte que l'asymétrie du troisième moment est négative.

Glen_b -Reinstate Monica
la source
1
@Peter Désolé pour la réponse lente, j'étais occupé à construire de tels exemples et je n'ai pas vu votre question.
Glen_b -Reinstate Monica
2
J'ai vu beaucoup de définitions de manuels scolaires et aucune ne l'a mentionné. Cool.
Peter Flom - Réintègre Monica
6
@Peter Malheureusement, beaucoup de manuels élémentaires ne font que répéter des informations incorrectes provenant d'autres manuels sans faire de véritable enquête eux-mêmes, et ainsi une idée fausse de base se propage. Les contre-exemples sont, comme vous le voyez, relativement faciles à construire (je les fais juste à la main au besoin). Kendall et Stuart ( Théorie avancée des statistiques, Vol I - ne vous laissez pas rebuter par le titre, c'est assez lisible), au moins les troisième et quatrième éditions, ont de bonnes informations. Les éditions plus récentes sont de Stuart et Ord. J'ai en fait posté ce problème sur CV plusieurs fois.
Glen_b -Reinstate Monica
4
Les binômes et montrent que la moyenne médiane est parfaitement cohérente avec l'asymétrie. Un point à propos de cet exemple est que personne ne peut le rejeter de manière convaincante comme obscur ou pathologique. ( 5(5k)0.8k0.25k=(5k)0.2k0.85k=
Nick Cox
1
@ Nick Oui, les binômes avec une moyenne entière sont de bons exemples.
Glen_b -Reinstate Monica
5

Non. Les données asymétriques à gauche ont une longue queue à gauche (extrémité inférieure), de sorte que la moyenne sera généralement inférieure à la médiane. (Mais voir la réponse de @Glen_b pour une exception). Mine de rien, je pense que les données qui «semblent» faussées à gauche auront une signification inférieure à la médiane.

Les données asymétriques à droite sont plus courantes; par exemple, le revenu. Là, la moyenne est supérieure à la médiane.

Code R

set.seed(123)  #set random seed
normdata <- rnorm(1000) #Normal data, skew = 0
extleft <- c(rep(-10, 5), rep(-20, 5)) #Some data to make skew left
alldata <- c(normdata,extleft)

library(moments)
skewness(alldata) #-6.77
mean(alldata) #-0.13
median(alldata) #-0.001
Peter Flom - Réintégrer Monica
la source
La moyenne peut-elle jamais être égale à la médiane?
Kunjan Kshetri
unj2 J'ai ajouté un exemple à ma réponse où l'asymétrie au troisième moment est négative mais moyenne = médiane.
Glen_b -Reinstate Monica