Avec deux variables, vous définissez un segment de ligne dans , comme vous l'avez souligné. Cependant, en raison de la contrainte simplex, l'une de ces deux variables est redondante en termes de spécification de la densité, car il existe une relation un à un entre et . Par conséquent, la densité est spécifiée sur les variables libres (c'est-à-dire dans )R2x1x2K−1R
Ceci est en fait souligné dans la première ligne de cette section de l'article Wikipedia, bien que très subtilement.
Par conséquent, votre fonction de densité devient:.
Dir1,1(x1,1−x1)=Γ(2)Γ(1)2(x1)0(1−x1)0=1
Donc,
∫10Dir1,1(x1,1−x1)dx1=1
Réponse au commentaire du PO
En raison des contraintes du simplexe, la densité de Dirichlet à deux variables est en fait dégénérée dans , comme le montre ma construction ci-dessus (elle ne nécessite qu'une seule variable). S'il est vrai qu'il a une densité de , il n'a pas de densité de sur le segment de ligne reliant à . Ce que la construction ci-dessus montre, c'est que la densité marginale a une valeur de . Votre confusion vient du fait de considérer comme une variable libre, auquel cas le support de Dirichlet surR211(1,0)(0,1)1x2R2aurait une zone non nulle. Cette intuition est bonne dans des cas comme le gaussien bivarié, où les deux variables ne sont pas parfaitement corrélées, mais pas dans ce cas.
Nous pouvons en déduire formellement ceci:
Soit un certain nombre dans spécifiant la distance de à long du segment de ligne de connexion. Ainsi, chaque valeur de identifie une paire unique . En utilisant cette notation, votre hypothèse selon laquelle la densité est de long de cette ligne se résume à:L[0,2–√](1,0)(0,1)L(x1,x2)1
P(L∈[a,b]⊂)=b−a
Cependant, nous pouvons montrer que ce n'est pas le cas à travers un traitement formel de la densité conjointe de :x1,x2
PL(L∈[a,b])=PX1,X2[(x1,x2)∈A[a,b]]
OùA[a,b]:={(u,v):u∈[1−b2√,1−a2√],v=1−u]
Maintenant, calculons :PL(L∈[a,b])
PL(L∈[a,b])=∫A[a,b]dPX1,X2=∫A[a,b]dPX1dPX2|X1=∫A[a,b]1dPX1=∫1−a2√1−b2√1du=
(1−a2–√)−(1−b2–√)=12–√(b−a)
Où la troisième égalité se produit parce que pour (c'est dire que ce n'est pas une densité, mais une masse de probabilité ponctuelle à )dPX2|X1=1X2=1−X11−X1
Comme vous pouvez le voir, nous avons récupéré la constante de normalisation pour la densité le long du segment de ligne dans . En effet, cette densité (dégénérée) des articulations n'est qu'une transformation linéaire de l'un des deux marginaux (l'un ou l'autre fonctionnera). Il en résulte que le domaine de la densité de probabilité passe de à , donc la densité doit diminuer pour compenser.12√R212–√