La moyenne = médiane implique-t-elle qu'une distribution unimodale est symétrique?

19

Pour une distribution unimodale, si moyenne = médiane suffit-il alors de dire que la distribution est symétrique?

Wikipedia dit en relation entre la moyenne et la médiane:

"Si la distribution est symétrique alors la moyenne est égale à la médiane et la distribution aura une asymétrie nulle. Si, en plus, la distribution est unimodale, alors la moyenne = médiane = mode. C'est le cas d'un tirage au sort ou séries 1,2,3,4, ... Notez cependant que l'inverse n'est pas vrai en général, c'est-à-dire que l'asymétrie nulle n'implique pas que la moyenne est égale à la médiane. "

Cependant, il n'est pas très simple (pour moi) de glaner les informations dont j'ai besoin. Toute aide s'il vous plaît.

kaka
la source

Réponses:

27

Voici un petit contre-exemple qui n'est pas symétrique: -3, -2, 0, 0, 1, 4 est unimodal avec mode = médian = moyenne = 0.

Modifier: un exemple encore plus petit est -2, -1, 0, 0, 3.

Si vous voulez imaginer une variable aléatoire plutôt qu'un échantillon, prenez le support {-2, -1, 0, 3} avec la fonction de masse de probabilité 0,2 sur chacun d'eux sauf pour 0 où il est 0,4.

Silverfish
la source
6
Je crois que -2, -1, 0, 0, 3 est le "plus petit" contre-exemple discret: nous avons besoin de deux valeurs égales pour créer un mode, l'ajout d'une troisième valeur distincte empêcherait la médiane d'égalisation moyenne, et une quatrième valeur ne peut que restaurer la signifie égaler la médiane en rétablissant la symétrie. Je soupçonne également que ces nombres sont les «plus petits» entiers (près de 0) possibles, puisque 3 est le plus petit nombre entier que nous pouvons écrire comme la somme de deux nombres entiers distincts. Distinct est vital, car essayer -1, -1, 0, 0, 2 ne serait plus unimodal! Naturellement, nous pouvons évoluer et traduire pour obtenir un nouvel ensemble de données avec cette propriété.
Silverfish
19

Cela a commencé comme un commentaire mais s'est allongé trop longtemps; J'ai décidé d'en faire plus d'une réponse.

UNEBBUNE

Je voudrais aborder quelques questions supplémentaires et souligner quelques réponses détaillées déjà ici qui sont liées dans une certaine mesure.

  1. La déclaration sur la page Wikipedia que vous citez n'est pas strictement vraie non plus. Prenons par exemple la distribution de Cauchy, qui est certes symétrique par rapport à sa médiane, mais qui n'a pas de moyenne. L'énoncé a besoin d'un qualificatif tel que «à condition que la moyenne et l'asymétrie existent». Même si nous la réduisons à l'affirmation la plus faible dans la première moitié de la première phrase, elle a encore besoin de "pourvu que la moyenne existe".

  2. Votre question confond en partie la symétrie avec l'asymétrie nulle (je suppose que vous avez l'intention de l'asymétrie au troisième moment, mais une discussion similaire pourrait être écrite pour d'autres mesures d'asymétrie). Avoir 0 asymétrie n'implique pas la symétrie. La dernière partie de votre citation et la section de Wikipédia citée par Alexis le mentionnent, bien que l'explication donnée dans la deuxième citation puisse utiliser quelques ajustements.

Cette réponse montre que la relation entre l'asymétrie du troisième moment et la direction de la relation entre la moyenne et la médiane est faible (l'asymétrie du troisième moment et l'asymétrie du deuxième Pearson n'ont pas besoin de correspondre).

Le point 1 de cette réponse donne un contre-exemple discret, similaire mais différent de celui donné par Silverfish.

Edit: J'ai finalement déterré l'exemple unimodal que je cherchais en fait plus tôt.

Dans cette réponse, je mentionne la famille suivante:

124exp(-X1/4)[1-αpéché(X1/4)]

α=0α=12

entrez la description de l'image ici

(les lignes grises montrent la densité bleue inversée autour de l'axe des x pour rendre l'asymétrie simple)

Whuber donne un autre exemple ici avec une asymétrie nulle qui est continue, unimodale et asymétrique. J'ai reproduit son schéma:

Exemples continus

qui montre l'exemple et le même retourné sur la moyenne (pour montrer clairement l'asymétrie) mais vous devriez aller lire l'original, qui contient beaucoup d'informations utiles.

[La réponse de Whuber donne ici une autre famille asymétrique de distributions continues avec tous les mêmes moments. Faire la même chose "choisissez deux, retournez-en un et prenez un mélange 50-50" a le même résultat asymétrique avec tous les moments impairs zéro, mais je pense que cela ne donne pas de résultats unimodaux ici (bien qu'il y ait peut-être quelques exemples). ]

La réponse ici traite de la relation entre la moyenne, la médiane et le mode.

Cette réponse traite des tests d'hypothèse de symétrie.

Glen_b -Reinstate Monica
la source
Merci beaucoup. Votre référence à ce stats.stackexchange.com/questions/56511/… était en fait la cause de la question ci-dessus.
kaka
8

Non.

Si, en plus, la distribution est unimodale, alors le mode moyen = médian =.

De la même manière que "si le bébé animal est un poulet, alors son origine est un œuf" n'implique pas que "si l'origine est un œuf, alors le bébé animal est un poulet".

Du même article Wikipedia:

Dans les cas où une queue est longue mais l'autre queue est grasse, l'asymétrie n'obéit pas à une règle simple. Par exemple, une valeur nulle indique que les queues des deux côtés de la moyenne s'équilibrent, ce qui est le cas à la fois pour une distribution symétrique et pour des distributions asymétriques où les asymétries sont égales, comme une queue longue mais mince, et le les autres étant courts mais gras.

Alexis
la source
1
Notez que dans le cas symétrique unimodal, vous pouvez avoir (exemples faciles à construire) mean = meadian = point avec une densité minimale (0)!
kjetil b halvorsen
2

Des exemples intéressants et faciles à comprendre proviennent de la distribution binomiale.

×=

            1        2
    +-------------------+
  1 |       0   .32768  |
  2 |       1    .4096  |
  3 |       2    .2048  |
  4 |       3    .0512  |
  5 |       4    .0064  |
  6 |       5   .00032  |
    +-------------------+

Le code Stata pour cet affichage était mata : (0..5)' , binomialp(5, (0..5), 0.2)'et vraisemblablement il est aussi simple ou plus simple dans tout logiciel statistique qui mérite d'être mentionné.

Pour une question de psychologie plutôt que de logique, cet exemple ne peut pas être rejeté de manière convaincante comme pathologique (comme dans d'autres problèmes, on pourrait exclure les distributions pour lesquelles certains moments n'existent même pas) ou comme un exemple bizarre ou trivial conçu à cet effet (comme par exemple les données inventées décrites par @Silverfish ou 0, 0, 1, 1, 1, 3).

Nick Cox
la source