Je ne connais aucune distribution multimodale.
Pourquoi toutes les distributions connues sont-elles unimodales? Y a-t-il une distribution "célèbre" qui a plus d'un mode?
Bien sûr, les mélanges de distributions sont souvent multimodaux, mais j'aimerais savoir s'il existe des distributions "non-mélange" qui ont plus d'un mode.
distributions
mode
Miroslav Sabo
la source
la source
Réponses:
On répond à la première partie de la question dans les commentaires à la question: de nombreuses distributions "de marque" sont multimodales, comme toute distribution Beta avec a < 1 et b < 1(a,b) a<1 b<1 . Passons donc à la deuxième partie de la question.
Toutes les distributions discrètes sont clairement des mélanges (d'atomes, qui sont unimodaux).
Je montrerai que la plupart des distributions continues sont également des mélanges de distributions unimodales. L'intuition derrière cela est simple: nous pouvons "poncer" les bosses d'un graphique cahoteux d'un PDF, un par un, jusqu'à ce que le graphique soit horizontal. Les bosses deviennent les composants du mélange, dont chacun est évidemment unimodal.
Par conséquent, à l'exception peut-être de certaines distributions inhabituelles dont les PDF sont très discontinus, la réponse à la question est «aucune»: toutes les distributions multimodales qui sont absolument continues, discrètes ou une combinaison de ces deux sont des mélanges de distributions unimodales.
Envisagez des distributions continues dont les PDFs fF f sont continus (ce sont les distributions "absolument continues"). (La continuité n'est pas vraiment une limitation; elle peut être encore assouplie par une analyse plus approfondie, en supposant simplement que les points de discontinuité sont discrets.)
Pour faire face aux "plateaux" de valeurs constantes qui peuvent se produire, définissez un "mode" comme étant un intervalle (qui pourrait être un point unique où x l =m=[xl,xu] ) tel quexl=xu
a une valeur constante sur m ,f m, disons .y
Il existe un nombre positif tel que la valeur maximale de f atteinte sur [ x l - ϵ ,ϵ f [xl−ϵ,xu+ϵ] est égale à .y
Soit tout mode de f . Parce que f est continu, il y a des intervalles [ x ′ l , x ′ u ] contenant m pour lesquels f est non décroissant dans [ x ′ l , x l ] (qui est un intervalle approprié, pas seulement un point) et non croissant dans [ x u , x ′ u ]m=[xl,xu] f f [x′l,x′u] m f [x′l,xl] [xu,x′u] (qui est également un intervalle approprié). Soit u le supremum de toutes ces valeurs. est l'infinimum de toutes ces valeurs etx ′x′l x′u
Cette construction a défini une "bosse" sur le graphe de s'étendant de x ' l à x ' u . Soit y le plus grand de f ( x ′ l ) et f ( x ′ u ) . Par construction, l'ensemble des points x dans [ x ′ l , x ′ u ] pour lesquels f ( x ) ≥ yf x′l x′u y f(x′l) f(x′u) x [x′l,x′u] f(x)≥y est un intervalle propre m′ contenant strictement (car il contient soit l'ensemble de [ x ′ l , x l ] ou [ x u , x ′ u ] ).m [x′l,xl] [xu,x′u]
Dans cette illustration d'un PDF multimodal, un mode est identifié par un point rouge sur l'axe horizontal. L'étendue horizontale de la portion rouge du remblai est l'intervalle m ' : c'est la base de la bosse déterminée par le mode m . La base de cette bosse est à la hauteur y ≈ 0,16 . Le PDF d'origine est la somme du remplissage rouge et du remplissage bleu. Notez que le remplissage bleu n'a qu'un seul mode près de 2 ; le mode d'origine à [ 0 , 0 ] a été supprimé.m=[0,0] m′ m y≈0.16 2 [0,0]
Écriture pour la durée de|m′| , définirm′
et
quand et f m ( x ) = 0 sinon. (Cela fait incidemment f m une fonction continue.) Le numérateur est la quantité par laquelle f s'élève au-dessus de y et le dénominateur p m est l'aire entre le graphique de f et y . Ainsi f m est non négatif et a une aire totale 1 : c'est le PDF d'une distribution de probabilité. Par construction, il a un mode unique m .x∈m′ fm(x)=0 fm f y pm f y fm 1 m
Aussi par construction, la fonction
is a PDF providedpm<1 . (Obviously if pm=1 there is nothing left of f, which must have been unimodal to begin with.) Moreover, it has no modes in the interval m′ (where it is constant, which is why the previous careful definition of a mode as an interval was necessary). Furthermore,
is a mixture of the unimodal PDFfm and the PDF f′m .
Iterate this procedure withf′m (which as a linear combination of continuous functions is still a continuous function, enabling us to proceed as before), producing a sequence of modes m=m1,m2,… ; corresponding sequences of weights p1=pm,p2=pm2,… ; and PDFs f1=fm,f2=fm2,…. The limiting result exists because (a) the interval where fi is flattened includes a proper interval that had not been flattened in the preceding i−1 operations and (b) the real numbers cannot be decomposed into more than a countable number of such intervals. The limit cannot have any modes and therefore is constant, which must be zero (for otherwise its integral would diverge). Consequently, f has been expressed (perhaps not uniquely, because the order in which modes were selected will matter) as a mixture
of unimodal distributions, QED.
la source
By unimodal, I think the OP plainly means that there is just one interior mode (i.e. excluding corner solutions). The question is thus really asking ...
i.e. why do most brand name distributions look something like this:
... plus or minus some skewness or some discontinuities? When the question is posed thus, the Beta distribution would not be a valid counter example.
It appears the OP's conjecture has some validity: most common brand name distributions do not allow for more than one interior mode. There may be theoretical reasons for this. For example, any distribution that is a member of the Pearson family (which includes the Beta) will necessarily be (interior) unimodal, as a consequence of the parent differential eqn that defines the entire family. And the Pearson family nests most of the best-known brand names.
Nevertheless, here are some brand name counter examples ...
Counter example
One brand-name counter-example is theSinc2 distribution with pdf:
defined on the real line. Here is a plot of theSinc2 pdf:
We could also perhaps add the family of cardiod and distributions related to this class ... with pdf plots such as:
The family of reflected brand name distributions would also perhaps be possible brand name contenders (though, these might be thought of as a 'cheat solution' ... but they are still brand names) such as the Reflected Weibull shown here:
la source
That you mightn't think of any doesn't mean there aren't any.
I can name "known" distributions that aren't unimodal.
For example, a Beta distribution withα and β both <1 .
http://en.wikipedia.org/wiki/Beta_distribution
also see
http://en.wikipedia.org/wiki/U-quadratic_distribution
(This isn't a special case of the beta distribution, in spite of the comment that says it is. The two families have some overlap, however.)
Mixture distributions are certainly known, and many of those are multimodal.
la source
Alpha-skew-normal distribution (Elal-Olivero 2010) has a PDF:
whereφ is the PDF of a standard Gaussian.
For|α|>1.34 the distribution is bimodal. Examplary plot for μ=1,σ=0.5,a=2 :
la source