Deux quantiles d'une distribution bêta déterminent-ils ses paramètres?

9

Si je donne deux quantiles (q1,q2) et leurs emplacements correspondants (l1,l2) (chacun) dans l'intervalle ouvert (0,1) , puis-je toujours trouver les paramètres d'une distribution bêta qui a ces quantiles à les emplacements spécifiés?

Bota
la source
1
Non, contre-exemple de base (q1, q2) = (0,1) et (l1, l2) = (0,1), peu importe les paramètres.
Tim
1
@Tim Je pense que je vois votre point, mais votre contre-exemple ne remplit pas les conditions que j'ai spécifiées (par exemple que les emplacements sont dans l'intervalle ouvert ). (0,1)
Bota
1
Je pense que vous pouvez le faire numériquement (et qu'il y aura une solution unique), mais cela impliquerait un petit effort.
Glen_b -Reinstate Monica
1
Je pense aussi - la résolution numérique n'est pas difficile, mais il n'est pas facile de trouver un argument pour l'unicité.
Elvis
1
@Elvis en fait, je soupçonne qu'il pourrait y avoir un moyen de le faire en regardant les logits des deux variables (les OP et q ). lq
Glen_b -Reinstate Monica

Réponses:

9

La réponse est oui, à condition que les données satisfassent à des exigences de cohérence évidentes. L'argument est simple, basé sur une construction simple, mais il nécessite une certaine configuration. Cela se résume à un fait intuitivement attrayant: l'augmentation du paramètre a dans une distribution bêta (a,b) augmente la valeur de sa densité (PDF) plus pour x plus grand que x plus petit ; et augmenter b fait le contraire: plus x est petit , plus la valeur du PDF augmente.

Les détails suivent.


Soit le quantile q1 souhaité soit x1 et le quantile q2 souhaité soit x2 avec 1>q2>q1>0 et (donc) 1>x2>x1>0 . Ensuite, il existe des a et b uniques pour lesquels la distribution bêta (a,b) a ces quantiles.

La difficulté à démontrer cela est que la distribution bêta implique une constante de normalisation récalcitrante. Rappelons la définition: pour a>0 et b>0 , la distribution Beta (a,b) a une fonction de densité (PDF)

f(x;a,b)=1B(a,b)xa1(1x)b1.

La constante de normalisation est la fonction bêta

B(a,b)=01xa1(1x)b1dx=Γ(a)Γ(b)Γ(a+b).

Tout devient compliqué si nous essayons de différencier f(x;a,b) directement par rapport à a et b , ce qui serait le moyen de force brute pour tenter une démonstration.

Une façon d'éviter d'avoir à analyser la fonction bêta est de noter que les quantiles sont des aires relatives . C'est,

qi=F(xi;a,b)=0xif(x;a,b)dx01f(x;a,b)dx

pour i=1,2 . Voici, par exemple, le PDF et la fonction de distribution cumulative (CDF) F d'un Beta (1.15,0.57) de distribution pour lesquels x1=1/3 et q1=1/6 .

Figure 1

La fonction de densité xf(x;a,b) est tracée à gauche. q1 est l' aire sous la courbe à gauche de x1 , indiquée en rouge, par rapport à l'aire totale sous la courbe. q2 est l'aire à gauche de x2 , égale à la somme des régions rouge et bleue, encore une fois par rapport à l'aire totale . Le CDF à droite montre comment (x1,q1) et (x2,q2) marquez deux points distincts dessus.

Sur cette figure, (x1,q1) a été fixé à (1/3,1/6) , a a été choisi pour être de 1.15 , et une valeur de b a été trouvée pour laquelle (x1,q1) se trouve sur le CDF bêta (a,b) .

Lemme : Un tel b peut toujours être trouvé.

Pour être précis, que (x1,q1) soit fixé une fois pour toutes. (Ils restent les mêmes dans les illustrations qui suivent: dans les trois cas, l'aire relative à gauche de x1 est égale à q1 ) Pour tout a>0 , le lemme affirme qu'il existe une valeur unique de b , écrite b(a), pour lequel x1 est le quantile q1 de la bêta (a,b(a)) Distribution.

Pour voir pourquoi, notons d'abord que lorsque b approche de zéro, toute la probabilité s'accumule près des valeurs de 0 , d'où F(x1;a,b) approche 1 . Lorsque b approche de l'infini, toute la probabilité s'accumule près des valeurs de 1 , d'où F(x1;a,b) s'approche de 0 . Entre les deux, la fonction bF(x1;a,b)augmente strictement en b .

Cette affirmation est géométriquement évidente: cela revient à dire que si nous regardons l'aire à gauche sous la courbe xxa1(1x)b1 rapport à l'aire totale sous la courbe et la comparons à la aire relative sous la courbe xxa1(1x)b1 pour b >b, alors cette dernière aire estrelativementplus grande. Le rapport de ces deux fonctions est ( 1 - x ) b - b . Il s'agit d'une fonction égale à 1 lorsque x = 0 , passant régulièrement à 0 lorsque x = 1.b>b(1x)bb1x=0,0x=1. Par conséquent, les hauteurs de la fonction xf(x;a,b) sont relativement plus grandes que les hauteurs de xf(x;a,b) pour x à gauche dex1 que pourx à droite dex1. Par conséquent, lazoneà gauche dex1 dans le premier doit êtrerelativementplus grande que la zone à droite dex1. (C'est simple à traduire en un argument rigoureux en utilisant une somme de Riemann, par exemple.)

Nous avons vu que la fonction bf(x1;a,b) est strictement croissante de façon monotone avec des valeurs limites à 0 et 1 en tant que b0 et b, respectivement. Il est également (clairement) continu. Par conséquent, il existe un certain nombreb(a)f(x1;a,b(a))=q1 et ce nombre est unique, prouvant le lemme.

Le même argument montre qu'à mesure que b augmente, l'aire à gauche de x2 augmente. Par conséquent, les valeurs de f(x2;a,b(a)) varient sur un certain intervalle de nombres au fur et à mesure que a progresse de presque 0 à presque . La limite de f(x2;a,b(a)) commea0 estq1.

Voici un exemple où a est proche de 0 (il est égal à 0.1 ). Avec x1=1/3 et q1=1/6 (comme dans la figure précédente),b(a)0.02. Il n'y a presque pas de zone entrex1 etx2:

Figure 2

Le CDF est pratiquement plat entre x1 et x2,q2 est pratiquement au-dessus de q1. Dans la limite a0 , q2q1.

À l'autre extrême, des valeurs suffisamment grandes d' a plomb à F(x2;a,b(a)) arbitrairement proches de1. Voici un exemple avec(x1,q1) comme précédemment.

figure 3

Ici, a=8 et b(a) est près de 10. Maintenant F(x2;a,b(a)) est essentiellement 1: il n'y a presque pas d'aire à droite de x2.

Par conséquent, vous pouvez sélectionner n'importe quel q2 entre q1 et 1 et ajuster a jusqu'à F(x2;a,a(b))=q2. Tout comme auparavant, cea doit être unique,QED.


Le Rcode de travail pour trouver des solutions est affiché à Déterminer les paramètres de distribution bêta et β à partir de deux points arbitraires (quantiles)αβ .

whuber
la source
Cette réponse montre que si nous avons choisi un ou un b fixe, nous trouverons une valeur correspondante unique. Il serait possible de construire des fonctions qui ont une zone fixe dans [ 0 , x 1 ] , [ x 1 , x 2 ] et [ x 2 , 1 ] . Je ne vois pas immédiatement pourquoi cela garantirait que l'ensemble de α et β est unique. Seriez-vous prêt à m'élaborer et à m'éclairer? ab[0,x1][x1,x2][x2,1]αβ
janvier
@Jan Pourriez-vous expliquer ce que vous entendez par "ensemble de et β "? Ces symboles n'apparaissent nulle part dans ce fil. αβ
whuber