Cet article est au-dessus de ma ligue mais il parle d'un sujet qui m'intéresse, la relation entre la moyenne, le mode et la médiane. Ça dit :
Il est largement admis que la médiane d'une distribution unimodale se situe «habituellement» entre la moyenne et le mode. Cependant, ceci n'est pas toujours vrai...
Ma question : quelqu'un peut-il fournir des exemples de distributions unimodales continues (idéalement simples) où la médiane est en dehors de l'intervalle [mode, moyenne]? Par exemple, une distribution telle que mode < mean < median
.
=== EDIT =======
Glen_b et Francis ont déjà de bonnes réponses, mais j'ai réalisé que ce qui m'intéresse vraiment est un exemple où le mode <moyenne <médiane ou médiane <moyenne <mode (c'est-à-dire que la médiane est à l'extérieur de [mode, moyenne] ET la médiane est "du même côté" comme moyenne du mode (c'est-à-dire à la fois au-dessus ou en dessous du mode)). Je peux accepter les réponses ici sont ouvertes une nouvelle question ou peut-être quelqu'un peut suggérer une solution ici directement?
Réponses:
Bien sûr, il n'est pas difficile de trouver des exemples - même continus unimodaux - où la médiane n'est pas entre la moyenne et le mode.
Considérons iid à partir d'une distribution triangulaire de la formef T ( t ) = 2 ( 1 - t ) 1 0 < t < 1T1, T2 FT( t ) = 2 ( 1 - t ) 10 < t < 1
Soit maintenant un mélange 60-40 de et .T 1 - 4 T 2X T1 - 4 T2
La densité de ressemble à ceci:X
La moyenne est inférieure à 0, le mode est à 0, mais la médiane est supérieure à 0. Une modification mineure de cela donnerait un exemple où même la densité (plutôt que juste le cdf) était continue, mais la relation entre les mesures de localisation était la même chose (modifier: voir 3. ci-dessous).
Généralisons, mettons une proportion (avec ) de la probabilité totale dans le triangle de droite et une proportion dans le triangle de gauche (à la place de 0,6 et 0,4 nous avions avant). De plus, faites le facteur d'échelle sur la moitié gauche plutôt que (avec ):0 < p < 1 ( 1 - p ) - β - 4 β > 0p 0 < p < 1 ( 1 - p ) - β - 4 β> 0
En supposant maintenant , la médiane sera toujours dans l'intervalle couvert par le triangle rectangle, donc la médiane dépassera le mode (qui restera toujours à ). En particulier, lorsque , la médiane sera de . 0p>1p > 12 0 1-1/√p > 12 Une - une / deux p--√
La moyenne sera à .( p - β( 1 - p ) ) / 3
Si alors la moyenne sera en dessous du mode, et si la moyenne sera au dessus du mode.β < p / ( 1 - p )β> p / ( 1 - p ) β< p / ( 1 - p )
En revanche, nous voulons que maintienne la moyenne en dessous de la médiane.( p - β( 1 - p ) ) / 3 < 1 - 1 / 2 p--√
Considérons ; cela place la médiane au-dessus du mode.p = 0,7
Alors satisferait donc la moyenne est au dessus du mode.β < p / ( 1 - p )β= 2 β< p / ( 1 - p )
La médiane est en fait à tandis que la moyenne est à . Donc pour et , nous avons le mode <moyenne <médiane. 0,7 - 2 ( 0,3 )1 - 1 / 1,4---√≈ 0,1548 p=0,7β=20,7 - 2 ( 0,3 )3≈ 0,0333 p = 0,7 β= 2
(NB Pour la cohérence avec ma notation, la variable sur l'axe des x pour les deux tracés devrait être plutôt que mais je ne vais pas revenir en arrière et la corriger.)tX t
Ceci est un exemple où la densité elle-même est continue. Il est basé sur l'approche en 1. et 2. ci-dessus, mais avec le "saut" remplacé par une pente raide (et ensuite la densité entière a basculé d'environ 0 parce que je veux un exemple qui semble droit).
[En utilisant l'approche "mélange de densités triangulaires", il peut être généré comme un mélange de 3 variables à échelle indépendante de la forme triangulaire décrite dans la section 1. Nous avons maintenant 15% , 60% et 25% .] - 3 T 2 5 T 3T1 - 3 T2 5 T3
Comme nous le voyons dans le diagramme ci-dessus, la moyenne est au milieu, comme demandé.
Notez que m_t_ mentionne le Weibull dans les commentaires (pour lesquels la médiane est en dehors de l' intervalle pour une petite plage du paramètre de forme ). C'est potentiellement satisfaisant car c'est une distribution unimodale continue (et fluide) bien connue avec une forme fonctionnelle simple.k[ mode , signifie ] k
En particulier, pour les petites valeurs du paramètre de forme Weibull, la distribution est asymétrique à droite, et nous avons la situation habituelle de médiane entre le mode et la moyenne, tandis que pour les grandes valeurs du paramètre de forme Weibull, la distribution est asymétrique à gauche , et nous avons à nouveau cette situation de "médiane au milieu" (mais maintenant avec le mode à droite plutôt que la moyenne). Entre ces cas se trouve une petite région où la médiane est en dehors de l'intervalle de mode moyen, et au milieu de celle-ci, la moyenne et le mode se croisent:
En choisissant des valeurs pratiques pour le paramètre de forme dans les intervalles marqués (1) et (2) ci-dessus - ceux où les écarts entre les statistiques de localisation sont à peu près égaux - nous obtenons:
Bien que ceux-ci répondent aux exigences, malheureusement, les trois paramètres de localisation sont si proches que nous ne pouvons pas les distinguer visuellement (ils tombent tous dans le même pixel), ce qui est un peu décevant - les cas pour mes exemples précédents sont beaucoup plus séparé. (Néanmoins, il suggère des situations à examiner avec d'autres distributions, dont certaines pourraient donner des résultats plus distincts visuellement.)
la source
L'exemple suivant est tiré des contre - exemples de Jordan Stoyanov en probabilité .
Étant donné la constante positive et , considérons une variable aléatoire de densité La moyenne , la médiane et le mode de peuvent être trouvés comme Remarque n'est une densité que si Donc, si nous laissons puis . Par conséquent, si nous choisissons un qui est proche dec λ X
la source
Prenez la distribution exponentielle avec le paramètre de vitesse a et la densité a exp (-ax) pour 0 <= x <infini. Le mode est à zéro. Bien sûr, la moyenne et la médiane sont supérieures à 0. Le cdf est 1-exp (-ax). Donc, pour la médiane, résolvez pour exp (-ax) = 0,5 pour x. Alors -ax = ln (0,5) ou x = -ln (0,5) / a. Pour la moyenne intégrez ax exp (-ax) de 0 à l'infini. Prenez a = 1 et nous avons une médiane = -ln (0,5) = ln (2) et une moyenne = 1.
Donc mode <médiane <moyenne.
la source