Quelqu'un peut-il offrir un exemple de distribution unimodale qui a une asymétrie de zéro mais qui n'est pas symétrique?

31

En mai 2010, l'utilisateur de Wikipédia Mcorazao a ajouté une phrase à l' article sur l' asymétrie : "Une valeur nulle indique que les valeurs sont distribuées de manière relativement uniforme des deux côtés de la moyenne, ce qui implique généralement, mais pas nécessairement, une distribution symétrique." Cependant, la page wiki n'a pas d'exemples réels de distributions qui enfreignent cette règle. Googler "exemple de distributions asymétriques avec une asymétrie nulle" ne donne pas non plus d'exemples réels, du moins dans les 20 premiers résultats.

En utilisant la définition selon laquelle l'inclinaison est calculée par , et le R formuleE[(Xμσ)3]

sum((x-mean(x))^3)/(length(x) * sd(x)^3)

Je peux construire une petite distribution arbitraire pour réduire l'asymétrie. Par exemple, la distribution

x = c(1, 3.122, 5, 4, 1.1) 

donne un biais de . Mais il s'agit d'un petit échantillon et de plus l'écart par rapport à la symétrie n'est pas important. Alors, est-il possible de construire une distribution plus grande avec un pic qui est très asymétrique mais qui a toujours une asymétrie presque nulle?5.64947105

Andy McKenzie
la source
3
Voulez-vous que la distribution soit unimodale ou non? Le titre le dit, mais le texte mentionne à peine ce point.
Dilip Sarwate
@Dilip Oui, je trouverais plus intéressant si la distribution était unimodale, car l'asymétrie, en tant que moment central, n'a pas vraiment de sens autrement.
Andy McKenzie

Réponses:

28

Considérez les distributions discrètes. Celui qui est pris en charge sur les valeurs est déterminé par des probabilités non négatives sous réserve des conditions (a) elles totalisent 1 et (b) le coefficient d'asymétrie est égal à 0 (ce qui équivaut au troisième moment central étant zéro). Cela laisse degrés de liberté (dans le sens de résolution d'équation, pas statistique!). Nous pouvons espérer trouver des solutions unimodales.x 1 , x 2 , , x k p 1 , p 2 , , p k k - 2kx1,x2,,xkp1,p2,,pkk2

Pour faciliter la recherche d'exemples, j'ai cherché des solutions prises en charge sur un petit vecteur symétrique avec un mode unique à , moyenne zéro et zéro asymétrie. Une telle solution est .0 ( p 1 , , p 7 ) = ( 1396 , 3286 , 9586 , 47386 , 8781 , 3930 , 1235 ) / 75600x=(3,2,1,0,1,2,3)0(p1,,p7)=(1396,3286,9586,47386,8781,3930,1235)/75600

Fonction de probabilité

Vous pouvez voir que c'est asymétrique.

Voici une solution plus évidemment asymétrique avec (qui est asymétrique) et :p = ( 1 , 18 , 72 , 13 , 4 ) / 108x=(3,1,0,1,2)p=(1,18,72,13,4)/108

Fonction de probabilité 2

Maintenant, ce qui se passe est évident: parce que la moyenne est égale à , les valeurs négatives contribuent et au troisième moment tandis que les valeurs positives contribuent et , équilibrant exactement les contributions négatives. Nous pouvons prendre une distribution symétrique d'environ , comme avec , et décaler une petite masse de à , une petite masse de à , et une légère masse à( - 3 ) 3 = - 27 18 × ( - 1 ) 3 = - 18 4 × 2 3 = 32 13 × 1 3 = 13 0 x = ( - 1 , 0 , 1 ) p = ( 1 , 4 , 1 ) / 6 + 1 + 2 + 1 - 10(3)3=2718×(1)3=184×23=3213×13=130x=(1,0,1)p=(1,4,1)/6+1+2+110 03, en maintenant la moyenne à et l'asymétrie à , tout en créant une asymétrie. La même approche fonctionnera pour maintenir une moyenne nulle et une asymétrie nulle d'une distribution continue tout en la rendant asymétrique; si nous ne sommes pas trop agressifs avec le transfert de masse, il restera unimodal.00


Modifier: distributions continues

Parce que le problème ne cesse de se poser, donnons un exemple explicite avec des distributions continues. Peter Flom a eu une bonne idée: regardez les mélanges de normales. Un mélange de deux normales ne fera pas l'affaire: lorsque son asymétrie disparaîtra, il sera symétrique. Le cas le plus simple suivant est un mélange de trois normales.

Les mélanges de trois normales, après un choix approprié d'emplacement et d'échelle, dépendent de six paramètres réels et devraient donc avoir plus que suffisamment de flexibilité pour produire une solution asymétrique sans asymétrie. Pour en trouver, il faut savoir calculer les asymétries des mélanges de normales. Parmi ceux-ci, nous rechercherons ceux qui sont unimodaux (il est possible qu'il n'y en ait pas).

Maintenant, en général, le moment (non central) d'une distribution normale standard est nul lorsque est impair et est égal à . Lorsque nous redimensionnons cette distribution normale standard pour avoir un écart-type de , le moment est multiplié par . Lorsque nous décalons une distribution de , le nouveau moment peut être exprimé en termes de moments jusqu'à inclusrthr σ2r/2Γ(1r2)/πσσ r μ r th rrthσrμrthr. Le moment d'un mélange de distributions (c'est-à-dire une moyenne pondérée) est la même moyenne pondérée des moments individuels. Enfin, l'asymétrie est nulle exactement lorsque le troisième moment central est nul, et cela est facilement calculé en termes des trois premiers moments.

Cela nous donne une attaque algébrique sur le problème. Une solution que j'ai trouvée est un mélange égal de trois normales avec des paramètres égaux à , et . Sa moyenne est égale à . Cette image montre le pdf en bleu et le pdf de la distribution a inversé sa moyenne en rouge. Le fait qu'ils diffèrent montre qu'ils sont tous les deux asymétriques. (Le mode est d'environ , différent de la moyenne de .) Ils ont tous deux une asymétrie de construction nulle .( 0 , 1 ) ( 1 / 2 , 1 ) ( 0 , (μ,σ)(0,1)(1/2,1)(0+1/deux+0)/3=1/60,05192161/6(0,127/18)(0,2.65623)(0+1/2+0)/3=1/60.05192161/6

Exemples continus

Les graphiques indiquent qu'ils sont unimodaux. (Vous pouvez vérifier en utilisant le calcul pour trouver les maxima locaux.)

whuber
la source
(+1) Réponse très simple. Est-ce que cela fonctionnera avec des distributions continues? Le changement ne créerait-il pas potentiellement de minuscules petits modes? Je ne pense peut-être pas droit ...
Macro
1
Vous pensez très bien, Macro: nous devrions tous être si sceptiques. L'astuce consiste à déplacer de petites quantités réparties sur de larges plages. Un test de première dérivée vous permettra de vérifier les modes possibles et fournit également la base d'une preuve que des décalages suffisamment petits de cette forme ne produiront pas de nouveaux modes.
whuber
Merci d'avoir répondu! Ceci est similaire à ce que je pensais intuitivement, même si je ne pouvais pas bien le dire - que vous devez "équilibrer" la masse de chaque côté de la distribution. Je me demande s'il existe des façons stéréotypées de réaliser cet équilibre.
Andy McKenzie
Une façon, Andy, est de commencer avec une solution discrète, puis de la convoluer avec une distribution normale. Dans ce cas, l'exigence d'unimodalité forcera cette distribution normale à avoir un grand écart-type. Même ainsi, si la convolution ne modifie pas sensiblement les propriétés requises (telles que l'asymétrie nulle), ou si elle la modifie de manière prévisible, vous avez une poignée mathématique sur le problème. Dans un certain sens, mon montage récent peut être considéré comme une telle attaque, bien que ce ne soit pas strictement une convolution (car les trois normales ont des écarts-types différents).
whuber
2
J'ai vérifié, Andy: convolutionner la solution discrète avec une distribution normale ne change pas l'asymétrie. Lorsque vous donnez à cette distribution normale un écart-type autour de 0,57 ou plus, le résultat est unimodal. Comme la distribution discrète sous-jacente, elle continue d'avoir une moyenne nulle, une asymétrie nulle et d'être asymétrique. Le mélange avec une distribution normale standard équivaut à un mouvement de masse contrôlé entre la distribution normale standard et la distribution discrète: cela pourrait répondre à votre demande d'une méthode "stéréotypée".
whuber
23

En voici un que j'ai trouvé sur https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html# que je trouve sympa et reproduit dans R: a reverse Burr ou distribution de Dagum avec paramètres de forme et :k=0.0629c=18.1484

g(x)=ckx(c+1)[1+xc](k+1)

Il a une moyenne de 0,5387, un écart-type de 0,2907, une asymétrie de 0,0000 et une kurtosis de 2 000. La source l'appelle également la "distribution des éléphants": entrez la description de l'image ici

Ma reproduction en R a été créée avec

library(actuar)
library(knotR)

# a nonsymmetric distribution with zero skewness
# see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html#

c <- 18.1484
k <- 0.0629

x <- seq(0,1.5,by=.0001)

elephant.density <- dinvburr(x, k, c)
plot(x,elephant.density, type="l")
polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey")
points(0.8,0.8, pch=19, cex=2)

# "ears" created via https://www.desmos.com/calculator/cahqdxeshd
ear.x <- c(0.686, 0.501, 0.42, 0.68)
ear.y <- c(0.698, 0.315, 1.095, 0.983)

myseg(bezier(cbind(ear.x, ear.y)), type="l")

EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf
EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k)
EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k)
(skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196

Comme le montre cette sortie, l'asymétrie n'est pas tout à fait de zéro à quatre chiffres pour ces valeurs de paramètre. Voici un petit optimiseur pour et :kc

   # optimize skewness a bit further
    skewval <- 1

while (skewval > 10^(-10)){
  optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c)
  skewval <- optskew.k$f.root
  k <- optskew.k$root

  optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k)
  skewval <- optskew.c$f.root
  c <- optskew.c$root
}

céder

> print(c)
[1] 18.89306

> print(k)
[1] 0.05975542

> print(skewval)
[1] -1.131464e-15
Christoph Hanck
la source
Merci pour la retouche. Cela dit, je n'ai pas pu reproduire l'asymétrie de 0,0000 à quatre chiffres, obtenant à la place 0,0001245138 (voir la modification suivante, dans le code R).
Christoph Hanck
On peut probablement exécuter un simple optimiseur pour trouver des valeurs et telles que l'asymétrie soit aussi proche de zéro que possible. Ce devrait être quelques lignes supplémentaires ou peut-être même une seule. Vous avez déjà la fonction de perte calculée analytiquement dans votre dernière ligne, existe-t-il un optimiseur générique approprié dans R? ck
amibe dit Réintégrer Monica le
En fait, 0,0003756196. 0.0001245138 était déjà après une optimisation initiale, donnée ici par erreur. J'irais regarder.
Christoph Hanck
@amoeba, j'ai essayé d'optimiser un peu, mais je ne prétends pas l'avoir fait de manière intelligente, j'ai peu d'expérience en optimisation.
Christoph Hanck
2
L'asymétrie qui est de zéro à trois chiffres (près de quatre) était beaucoup dans mon esprit; ce n'est pas comme si une valeur plus précise la rendrait différente. Si l'asymétrie traversera zéro dans ce voisinage et qu'il est clair dans quelles directions modifier les valeurs si plus de précision est nécessaire, je pense que cela suffit. Mais bravo pour l'effort supplémentaire. (C'est un bel exemple, au fait.)
Glen_b -Reinstate Monica
9

Considérons une distribution sur la moitié positive de la ligne réelle qui augmente linéairement de 0 au mode, puis est exponentielle à droite du mode, mais continue au mode.

Cela pourrait être appelé une distribution triangulaire-exponentielle (bien qu'elle ressemble souvent un peu à une nageoire de requin).

Soit l'emplacement du mode et le paramètre de vitesse de l'exponentielle.θλ

À mesure que augmente, la distribution devient progressivement moins asymétrique. Lorsque augmente au-delà de le troisième moment passe du positif au négatif:λθλθ6.15

Triangulaire-exponentielle avec une asymétrie nulle

Brizzi (2006) réfère à cette famille de distributions comme la distribution "à deux faces", et discute de ce point de croisement où l'asymétrie du troisième moment est nulle. von Hippel (2005) présente un exemple qui est presque à ce point de croisement ici[1][2]

Le fil distributions non normales avec zéro asymétrie et zéro excès de kurtosis? a quelques exemples asymétriques, y compris un petit exemple discret et un autre unimodal continu:

Mélange gaussien unimodal avec asymétrie nulle

Des distributions unimodales discrètes - ou équivalentes, des échantillons - avec une asymétrie nulle sont assez faciles à construire, de grande ou de petite taille.

Voici un exemple, que vous pouvez traiter comme un échantillon ou (en divisant les fréquences brutes par 3000) comme un pmf (les valeurs «x» sont les valeurs prises, les «n» sont le nombre de fois où la valeur se produit dans l'échantillon ):

x:  -2   -1    0    1    2    3    4    5    6    7    8    9   10
n: 496  498  562 1434    2    1    1    1    1    1    1    1    1

Un graphique de la fonction de masse de probabilité construite à partir de ce qui précède

Cet exemple est construit à partir de distributions en 3 points:

x:          -2              1                  c
n:   c(c-1)(c+1)/6     c(c-1)(c+1)/3 - c       1

sur diverses valeurs de entre 3 et 10. Cet "atome" paramétré (par ) à 3 points a et , ce qui signifie à son tour que les mélanges à travers différents choix de ont zéro asymétrie. (Vous ne pouvez pas faire quelque chose de plus petit qu'une distribution sur trois points qui a une asymétrie et un troisième moment central zéro. Une collection de pièces simples sur seulement quelques points, telles que celles-ci font des blocs de construction soignés à partir desquels des structures plus grandes peuvent être faites.)c i n i x i = 0 i n i x 3 i = 0 cccinixi=0inixi3=0c

Il existe toutes sortes d'autres "atomes" de ce genre, mais cet exemple utilise uniquement ce type. A une certaine combinaison d'atomes tels que ceux-ci s'ajoutent quelques valeurs placées symétriquement pour remplir les trous restants et garantir l'unimodalité sans détruire la structure du moment moyen et du troisième moment.

[1] Brizzi, M. (2006),
«Un modèle asymétrique combinant des caractéristiques triangulaires et exponentielles: la distribution à deux faces et ses propriétés statistiques»,
Austrian Journal of Statistics , 35 : 4, p455–462
http: //www.stat .tugraz.at / AJS / ausg064 /

[2] von Hippel, PT (2005),
«Mean, Median, and Skew: Correcting a Textbook Rule»
Journal of Statistics Education Volume 13, Number 2,
http://ww2.amstat.org/publications/jse/v13n2/ vonhippel.html

Glen_b -Reinstate Monica
la source
3
Pourrait peut-être l'appeler le "Shark-fin" peut-être?
Glen_b -Reinstate Monica
@Glen_b Totalement Shark-fin en effet.
Alecos Papadopoulos
2

Sûr. Essaye ça:

skew= function (x, na.rm = FALSE) 
 {
    if (na.rm)    x <- x[!is.na(x)]             #remove missing values
    sum((x - mean(x))^3)/(length(x) * sd(x)^3)  #calculate skew   
 }

set.seed(12929883) 
x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1))

 skew(x)
 plot(density(x))

(Vous avez déjà fait les choses difficiles!)

Peter Flom - Rétablir Monica
la source
1
bien j'aime ça. +1
gung - Réintègre Monica
4
Ce n'est pas bimodal ... c'est horriblement multimodal . Essayez de tracer la densité; curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
invité
1
Les données ainsi générées ne sont certainement pas unimodales. Tout ce que vous devez faire pour le voir est de copier-coller votre code, mot pour mot. En effet, un mélange de variables normalement distribuées ne sera jamais unimodal (à moins bien sûr que l'une des proportions du mélange soit 1).
Macro
8
@Macro, ce n'est pas correct. Voir, par exemple, l'abrégé de Roeder 1994 (JASA) pour le résultat bien connu que «la densité de deux normales mixtes n'est pas bimodale à moins que les moyennes ne soient séparées d'au moins 2 écarts-types». S'ils sont séparés par moins que cela, le mélange est unimodal.
invité
1
Vous avez raison @ invité. J'avais oublié cette possibilité quand j'ai fait mon post
Macro
2

Pour une asymétrie nulle, nous avons besoin de ou, de manière équivalente,

E[(Xμσ)3]=0
E[(Xμσ)3|Xμ]+E[(Xμσ)3|X>μ]=0.

Maintenant, pour une moyenne et une variance données, choisissez deux distributions et avec une masse nulle sur le côté droit de et et définissez pour qu'il corresponde à s'il reste à gauche de et sinon. (Je ne connais pas la notation exacte pour cela, quelqu'un veut-il aider?)YZμ XYμ(μ-Z)

E[(Yμσ)3]=E[(Zμσ)3]
XYμ(μZ)

La distribution résultante sera unimodale si les fichiers PDF de et augmentent à gauche de (en plus d'être nul à droite de ).Z μ μYZμμ

krlmlr
la source
1
Comment garantissez-vous que la distribution est unimodale?
Dilip Sarwate
Merci de l'avoir signalé. Les fichiers PDF de et devront être strictement croissants jusqu'à , puis tomber à zéro. Z μYZμ
krlmlr
Ceci est la bonne idée , mais il faut encore un peu de travail, car peut changer lors de la combinaison et . Y ZσYZ
whuber
@whuber: Merde. Je savais qu'il devait y avoir un piège ... :-)
krlmlr
2

La distribution discrète suivante est asymétrique et a une asymétrie nulle: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1/6. Je l'ai trouvé dans l'article de Doric et al., Qual Quant (2009) 43: 481-493; DOI 10.1007 / s11135-007-9128-9

Petitjean
la source
+1 Il vérifie et c'est unimodal. Voilà l'exemple le plus simple possible.
whuber