Contre-exemples où la médiane est en dehors [Mode-Mean]

11

Cet article est au-dessus de ma ligue mais il parle d'un sujet qui m'intéresse, la relation entre la moyenne, le mode et la médiane. Ça dit :

Il est largement admis que la médiane d'une distribution unimodale se situe «habituellement» entre la moyenne et le mode. Cependant, ceci n'est pas toujours vrai...

Ma question : quelqu'un peut-il fournir des exemples de distributions unimodales continues (idéalement simples) où la médiane est en dehors de l'intervalle [mode, moyenne]? Par exemple, une distribution telle que mode < mean < median.

=== EDIT =======

Glen_b et Francis ont déjà de bonnes réponses, mais j'ai réalisé que ce qui m'intéresse vraiment est un exemple où le mode <moyenne <médiane ou médiane <moyenne <mode (c'est-à-dire que la médiane est à l'extérieur de [mode, moyenne] ET la médiane est "du même côté" comme moyenne du mode (c'est-à-dire à la fois au-dessus ou en dessous du mode)). Je peux accepter les réponses ici sont ouvertes une nouvelle question ou peut-être quelqu'un peut suggérer une solution ici directement?

Janthelme
la source
Il n'est pas difficile d'étendre la réponse pour couvrir le cas le plus restreint.
Glen_b -Reinstate Monica
2
Consultez la figure 6 ici: ww2.amstat.org/publications/jse/v13n2/vonhippel.html qui donne un exemple de Weibull (unimodal continu) où la médiane n'est pas entre le mode et la moyenne.
Matthew Towers

Réponses:

14

Bien sûr, il n'est pas difficile de trouver des exemples - même continus unimodaux - où la médiane n'est pas entre la moyenne et le mode.

  1. Considérons iid à partir d'une distribution triangulaire de la formef T ( t ) = 2 ( 1 - t ) 1 0 < t < 1T1,T2FT(t)=2(1-t)10<t<1

    Soit maintenant un mélange 60-40 de et .T 1 - 4 T 2XT1-4T2

    La densité de ressemble à ceci:X

    Mélange de deux densités triangulaires avec la médiane en dehors de l'intervalle moyen-mode

    La moyenne est inférieure à 0, le mode est à 0, mais la médiane est supérieure à 0. Une modification mineure de cela donnerait un exemple où même la densité (plutôt que juste le cdf) était continue, mais la relation entre les mesures de localisation était la même chose (modifier: voir 3. ci-dessous).

  2. Généralisons, mettons une proportion (avec ) de la probabilité totale dans le triangle de droite et une proportion dans le triangle de gauche (à la place de 0,6 et 0,4 nous avions avant). De plus, faites le facteur d'échelle sur la moitié gauche plutôt que (avec ):0 < p < 1 ( 1 - p ) - β - 4 β > 0p0<p<1(1-p)-β-4β>0

    densité pour la version généralisée de ce mélange de deux densités triangulaires

    En supposant maintenant , la médiane sera toujours dans l'intervalle couvert par le triangle rectangle, donc la médiane dépassera le mode (qui restera toujours à ). En particulier, lorsque , la médiane sera de . 0p>1p>120 1-1/p>121-1/2p

    La moyenne sera à .(p-β(1-p))/3

    Si alors la moyenne sera en dessous du mode, et si la moyenne sera au dessus du mode.β < p / ( 1 - p )β>p/(1-p)β<p/(1-p)

    En revanche, nous voulons que maintienne la moyenne en dessous de la médiane.(p-β(1-p))/3<1-1/2p

    Considérons ; cela place la médiane au-dessus du mode.p=0,7

    Alors satisferait donc la moyenne est au dessus du mode.β < p / ( 1 - p )β=2β<p/(1-p)

    La médiane est en fait à tandis que la moyenne est à . Donc pour et , nous avons le mode <moyenne <médiane. 0,7 - 2 ( 0,3 )1-1/1.40,1548p=0,7β=20,7-2(0,3)30,0333p=0,7β=2

    (NB Pour la cohérence avec ma notation, la variable sur l'axe des x pour les deux tracés devrait être plutôt que mais je ne vais pas revenir en arrière et la corriger.)tXt

  3. Ceci est un exemple où la densité elle-même est continue. Il est basé sur l'approche en 1. et 2. ci-dessus, mais avec le "saut" remplacé par une pente raide (et ensuite la densité entière a basculé d'environ 0 parce que je veux un exemple qui semble droit).

    densité linéaire continue par morceaux avec médiane <moyenne <mode

    [En utilisant l'approche "mélange de densités triangulaires", il peut être généré comme un mélange de 3 variables à échelle indépendante de la forme triangulaire décrite dans la section 1. Nous avons maintenant 15% , 60% et 25% .] - 3 T 2 5 T 3T1-3T25T3

    Comme nous le voyons dans le diagramme ci-dessus, la moyenne est au milieu, comme demandé.


  1. Notez que m_t_ mentionne le Weibull dans les commentaires (pour lesquels la médiane est en dehors de l' intervalle pour une petite plage du paramètre de forme ). C'est potentiellement satisfaisant car c'est une distribution unimodale continue (et fluide) bien connue avec une forme fonctionnelle simple.k[mode,signifier]k

    En particulier, pour les petites valeurs du paramètre de forme Weibull, la distribution est asymétrique à droite, et nous avons la situation habituelle de médiane entre le mode et la moyenne, tandis que pour les grandes valeurs du paramètre de forme Weibull, la distribution est asymétrique à gauche , et nous avons à nouveau cette situation de "médiane au milieu" (mais maintenant avec le mode à droite plutôt que la moyenne). Entre ces cas se trouve une petite région où la médiane est en dehors de l'intervalle de mode moyen, et au milieu de celle-ci, la moyenne et le mode se croisent:

          k                 order
     (0,3.2589)      mode < median < mean
      ≈ 3.2589       mode = median < mean
    (3.2589,3.3125)  median < mode < mean    (1)
      ≈ 3.3215       median < mode = mean
    (3.3215,3.4395)  median < mean < mode    (2)
      ≈ 3.4395       median = mean < mode
      3.4395+        mean < median < mode
      (≈3.60235      moment-skewness = 0)
    

    En choisissant des valeurs pratiques pour le paramètre de forme dans les intervalles marqués (1) et (2) ci-dessus - ceux où les écarts entre les statistiques de localisation sont à peu près égaux - nous obtenons:

    Densités de Weibull avec médiane en dehors de l'intervalle moyen-mode

    Bien que ceux-ci répondent aux exigences, malheureusement, les trois paramètres de localisation sont si proches que nous ne pouvons pas les distinguer visuellement (ils tombent tous dans le même pixel), ce qui est un peu décevant - les cas pour mes exemples précédents sont beaucoup plus séparé. (Néanmoins, il suggère des situations à examiner avec d'autres distributions, dont certaines pourraient donner des résultats plus distincts visuellement.)

Glen_b -Reinstate Monica
la source
Cela fonctionne, merci. Par curiosité, quelle serait une "distribution triangulaire" similaire où mode <signifie <médiane? (ici médiane <mode <moyenne)
Janthelme
En fait, dans mon exemple d'origine, signifie <mode <médiane; vous aviez les inégalités en arrière là-bas. J'ai maintenant ajouté un exemple similaire où la moyenne est au-dessus du mode mais en dessous de la médiane (en effet, vous auriez simplement pu remplacer l'original par disons et garder les proportions du mélange à pour la partie droite et pour la partie droite). partie gauche). - 1,25 T 2 0,6 0,4-4T2-1,25T20,60,4
Glen_b -Reinstate Monica
6

L'exemple suivant est tiré des contre - exemples de Jordan Stoyanov en probabilité .

Étant donné la constante positive et , considérons une variable aléatoire de densité La moyenne , la médiane et le mode de peuvent être trouvés comme Remarque n'est une densité que si Donc, si nous laissons puis . Par conséquent, si nous choisissons un qui est proche decλX

f(x)={ceλ(xc),x(c,)x,x(0,c]0,x(,0].
μmMXf ( x ) c 2
μ=c33+c2λ+cλ2,m=1,M=c.
F(X)c1λ2c>111.0001μ>cM=cmμM
c22+cλ=1.
c1λ2c>11 (disons ), nous pouvons constater que et , donc médiane ne tombe pas entre et .1.0001μ>cM=cmμM
Francis
la source
0

Prenez la distribution exponentielle avec le paramètre de vitesse a et la densité a exp (-ax) pour 0 <= x <infini. Le mode est à zéro. Bien sûr, la moyenne et la médiane sont supérieures à 0. Le cdf est 1-exp (-ax). Donc, pour la médiane, résolvez pour exp (-ax) = 0,5 pour x. Alors -ax = ln (0,5) ou x = -ln (0,5) / a. Pour la moyenne intégrez ax exp (-ax) de 0 à l'infini. Prenez a = 1 et nous avons une médiane = -ln (0,5) = ln (2) et une moyenne = 1.

Donc mode <médiane <moyenne.

Michael R. Chernick
la source
1
Désolé, mais ne cherchons-nous pas des distributions où mode <signifie <médiane (ou plus généralement où la médiane est en dehors de [mode, moyenne])?
Janthelme
3
Désolé pour la confusion, j'ai ajouté à la question d'origine, mais ce que je demandais à l'origine, c'est pour des exemples où la médiane est en dehors de [mode, moyenne] alors que je pense que la médiane est à l'intérieur de [mode, médiane] dans votre exemple.
Janthelme
3
Michael, la question ne demande pas un cas où la médiane se situe entre le mode et la moyenne. Vous avez mal cité l'original dans votre commentaire juste au-dessus de celui-ci; la question ne dit pas "mode <médiane <moyenne" où vous déclarez que c'est le cas (et ne l'a jamais fait à aucun moment de l'historique des modifications). Par conséquent, votre réponse fournit un cas qui n'est pas demandé; c'est en effet la situation habituelle (médiane au milieu des deux autres) dont la question cherche des exceptions. Presque toutes les distributions unimodales asymétriques bien connues ont la médiane au milieu - l'astuce consiste à trouver celles qui ne le font pas.
Glen_b -Reinstate Monica
1
L'historique des modifications est disponible en cliquant sur le lien rouge au bas de la question où il est actuellement dit "modifié il y a 18 heures" (il est passé à 19 pendant que je tapais ces commentaires). Vous pouvez voir l'historique des modifications en cliquant ici. La question a été publiée il y a 22 heures (au fur et à mesure que je tape ceci), et lorsque vous cliquez sur l'historique des modifications, la question d'origine peut être vue en bas intitulée "1". Votre réponse est apparue environ 2 heures plus tard (il y a 20 heures), alors que c'était toujours la question. Environ 1 à 2 heures après votre message, le PO a modifié sa question une fois, ce qui peut être vu ...
Glen_b -Reinstate Monica
1
ctd ... en haut de l'historique des modifications .. Il y a une fenêtre de deux minutes après chaque modification pour apporter des modifications qui comptent dans le cadre de cette modification (c.-à-d. il y a 22 heures et 18-19 heures il y avait une fenêtre minute à chaque fois où disons qu'une faute de frappe aurait pu être corrigée) mais il y a environ 20 heures lorsque vous avez publié, la question était restée inchangée pendant environ 2 heures, et elle est restée inchangée pendant plus d'une heure après la publication, lors d'une modification majeure ( affiché dans l'historique des modifications) a été effectuée. Toutes les modifications en dehors de ces brèves fenêtres de post-modification de deux minutes seraient dans l'historique des modifications.
Glen_b -Reinstate Monica