Formule de probabilité pour une distribution bernoulli multivariée

13

J'ai besoin d'une formule pour la probabilité d'un événement dans une distribution de Bernoulli à n variables X{0,1}n avec des probabilités P(Xi=1)=pi pour un seul élément et pour des paires d'éléments P(Xi=1Xj=1)=pij . Je pourrais vous donner de manière équivalente moyenne et covariance de X .

J'ai déjà appris qu'il existe de nombreuses distributions {0,1}n ayant les propriétés tout comme il existe de nombreuses distributions ayant une moyenne et une covariance données. Je recherche une canonique sur {0,1}n , tout comme la gaussienne est une distribution canonique pour Rn et une moyenne et une covariance données.

mpiktas
la source

Réponses:

11

La variable aléatoire prenant des valeurs dans est une variable aléatoire discrète. Sa distribution est entièrement décrite par les probabilités p i = P ( X = i ) avec i{ 0 , 1 } n . Les probabilités p i et p i j que vous donnez sont des sommes de p i pour certains indices i .{0,1}npi=P(X=i)i{0,1}npipijpii

Il semble maintenant que vous souhaitiez décrire en utilisant uniquement p i et p i j . Ce n'est pas possible sans supposer certaines propriétés sur p i . Pour voir que essayer de tirer fonction caractéristique de X . Si nous prenons n = 3, nous obtenonspipipijpiXn=3

Il n'est pas possible de réorganiser cette expression pour quep i

Eei(t1X1+t2X2+t3X3)=p000+p100eit1+p010eit2+p001eit3+p110ei(t1+t2)+p101ei(t1+t3)+p011ei(t2+t3)+p111ei(t1+t2+t3)
pi dissapear. For the gaussian random variable the characteristic function depends only on mean and covariance parameters. Characteristic functions uniquely define distributions, so this is why Gaussian can be described uniquely by using only mean and covariance. As we see for random variable X this is not the case.

 

mpiktas
la source
10

See the following paper:

J. L. Teugels, Some representations of the multivariate Bernoulli and binomial distributions, Journal of Multivariate Analysis, vol. 32, no. 2, Feb. 1990, 256–268.

Here is the abstract:

Des versions multivariées mais vectorisées pour les distributions de Bernoulli et binomiales sont établies en utilisant le concept de produit Kronecker du calcul matriciel. La distribution de Bernoulli multivariée implique un modèle paramétré, qui fournit une alternative au modèle log-linéaire traditionnel pour les variables binaires.

Hamed
la source
2
Merci d'avoir partagé cela, Hamed. Bienvenue sur notre site!
whuber
1

I don't know what the resulting distribution is called, or if it even has a name, but it strikes me the obvious way to set this up is to think of the model you'd use to model a 2×2×2×…×2 table using a log-linear (Poisson regression) model. As you know the 1st-order interactions only, it's then natural to assume that all higher-order interactions are zero.

Using the questioner's notation, this gives the model:

P(X1=x1,X2=x2,,Xn=xn)=i[pixi(1pi)1xij<i(pijpipj)xixj]
onestop
la source
This formula has notational problems: there are p's on the left and the right. The right side makes no reference at all to the subscript i. Furthermore, still interpreting the pi as probabilities (as in the original question), the rhs clearly is positive whereas the lhs cannot be positive.
whuber
@whuber Quite right! I stick by the model I set out in the first para, but my equation was screwed up in several ways... Goes to show I haven't actually used log-linear modelling of contingency tables since my MSc, and I haven't got the notes or books to hand. I believe I've fixed it now though. Let me know if you agree! Apols for the delay. Some days my brain just doesn't do algebra.
onestop
1
I don't think this works. Assume pi=1/n and pij=0ij. This is a valid combination of probabilities, realized when I is a uniform random variable {1,...,n} and XI=1 and all Xj=0jI. Still the formula above would be 0 for all events. Still thanks for helping!