Si je donne deux quantiles et leurs emplacements correspondants (chacun) dans l'intervalle ouvert , puis-je toujours trouver les paramètres d'une distribution bêta qui a ces quantiles à les emplacements spécifiés?
9
Si je donne deux quantiles et leurs emplacements correspondants (chacun) dans l'intervalle ouvert , puis-je toujours trouver les paramètres d'une distribution bêta qui a ces quantiles à les emplacements spécifiés?
Réponses:
La réponse est oui, à condition que les données satisfassent à des exigences de cohérence évidentes. L'argument est simple, basé sur une construction simple, mais il nécessite une certaine configuration. Cela se résume à un fait intuitivement attrayant: l'augmentation du paramètreune dans une distribution bêta (a,b) augmente la valeur de sa densité (PDF) plus pour x plus grand que x plus petit ; et augmenter b fait le contraire: plus x est petit , plus la valeur du PDF augmente.
Les détails suivent.
La difficulté à démontrer cela est que la distribution bêta implique une constante de normalisation récalcitrante. Rappelons la définition: poura>0 et b>0 , la distribution Beta (a,b) a une fonction de densité (PDF)
La constante de normalisation est la fonction bêta
Tout devient compliqué si nous essayons de différencierF( x ; a , b ) directement par rapport à une et b , ce qui serait le moyen de force brute pour tenter une démonstration.
Une façon d'éviter d'avoir à analyser la fonction bêta est de noter que les quantiles sont des aires relatives . C'est,
pouri = 1 , 2 . Voici, par exemple, le PDF et la fonction de distribution cumulative (CDF) F d'un Beta ( 1,15 , 0,57 ) de distribution pour lesquels X1= Une / 3 et q1= Une / six .
La fonction de densitéx→f(x;a,b) est tracée à gauche. q1 est l' aire sous la courbe à gauche de x1 , indiquée en rouge, par rapport à l'aire totale sous la courbe. q2 est l'aire à gauche de x2 , égale à la somme des régions rouge et bleue, encore une fois par rapport à l'aire totale . Le CDF à droite montre comment (x1,q1) et (x2,q2) marquez deux points distincts dessus.
Sur cette figure,(x1,q1) a été fixé à (1/3,1/6) , a a été choisi pour être de 1.15 , et une valeur de b a été trouvée pour laquelle (x1,q1) se trouve sur le CDF bêta (a,b) .
Lemme : Un telb peut toujours être trouvé.
Pour être précis, que(x1,q1) soit fixé une fois pour toutes. (Ils restent les mêmes dans les illustrations qui suivent: dans les trois cas, l'aire relative à gauche de x1 est égale à q1 ) Pour tout a>0 , le lemme affirme qu'il existe une valeur unique de b , écrite b(a), pour lequel x1 est le quantile q1 de la bêta (a,b(a)) Distribution.
Pour voir pourquoi, notons d'abord que lorsqueb approche de zéro, toute la probabilité s'accumule près des valeurs de 0 , d'où F(x1;a,b) approche 1 . Lorsque b approche de l'infini, toute la probabilité s'accumule près des valeurs de 1 , d'où F(x1;a,b) s'approche de 0 . Entre les deux, la fonction b→F(x1;a,b) augmente strictement en b .
Cette affirmation est géométriquement évidente: cela revient à dire que si nous regardons l'aire à gauche sous la courbex→xa−1(1−x)b−1 rapport à l'aire totale sous la courbe et la comparons à la aire relative sous la courbe x→xa−1(1−x)b′−1 pour b ′ >b, alors cette dernière aire estrelativementplus grande. Le rapport de ces deux fonctions est ( 1 - x ) b ′ - b . Il s'agit d'une fonction égale à 1 lorsque x = 0 , passant régulièrement à 0 lorsque x = 1.b′>b (1−x)b′−b 1 x=0, 0 x=1. Par conséquent, les hauteurs de la fonction x→f(x;a,b′) sont relativement plus grandes que les hauteurs de x→f(x;a,b) pour x à gauche dex1 que pourx à droite dex1. Par conséquent, lazoneà gauche dex1 dans le premier doit êtrerelativementplus grande que la zone à droite dex1. (C'est simple à traduire en un argument rigoureux en utilisant une somme de Riemann, par exemple.)
Nous avons vu que la fonctionb→f(x1;a,b) est strictement croissante de façon monotone avec des valeurs limites à 0 et 1 en tant que b→0 et b→∞, respectivement. Il est également (clairement) continu. Par conséquent, il existe un certain nombreb(a) oùf(x1;a,b(a))=q1 et ce nombre est unique, prouvant le lemme.
Le même argument montre qu'à mesure queb augmente, l'aire à gauche de x2 augmente. Par conséquent, les valeurs de f(x2;a,b(a)) varient sur un certain intervalle de nombres au fur et à mesure que a progresse de presque 0 à presque ∞. La limite de f(x2;a,b(a)) commea→0 estq1.
Voici un exemple oùa est proche de 0 (il est égal à 0.1 ). Avec x1=1/3 et q1=1/6 (comme dans la figure précédente),b(a)≈0.02. Il n'y a presque pas de zone entrex1 etx2:
Le CDF est pratiquement plat entrex1 et x2, où q2 est pratiquement au-dessus de q1. Dans la limite a→0 , q2→q1.
À l'autre extrême, des valeurs suffisamment grandes d'a plomb à F(x2;a,b(a)) arbitrairement proches de1. Voici un exemple avec(x1,q1) comme précédemment.
Ici,a=8 et b(a) est près de 10. Maintenant F(x2;a,b(a)) est essentiellement 1: il n'y a presque pas d'aire à droite de x2.
Par conséquent, vous pouvez sélectionner n'importe quelq2 entre q1 et 1 et ajuster a jusqu'à F(x2;a,a(b))=q2. Tout comme auparavant, cea doit être unique,QED.
Leα β .
R
code de travail pour trouver des solutions est affiché à Déterminer les paramètres de distribution bêta et β à partir de deux points arbitraires (quantiles)la source