Visualisez la distribution binomiale bivariée

11

Question: à quoi ressemble une distribution binomiale bivariée dans un espace tridimensionnel?

Ci-dessous se trouve la fonction spécifique que je voudrais visualiser pour différentes valeurs des paramètres; à savoir, n , et . p 2p1p2

f(x1,x2)=n!x1!x2!p1x1p2x2,x1+x2=n,p1+p2=1.

Notez qu'il existe deux contraintes; et . De plus, est un entier positif, disons .p 1 + p 2 = 1 n 5x1+x2=np1+p2=1n5

In a fait deux tentatives pour tracer la fonction à l'aide de LaTeX (TikZ / PGFPLOTS). Ce faisant, j'obtiens les graphiques ci-dessous pour les valeurs suivantes: , et , et, , p_ {1} = 0,4 et p_ {2} = 0,6 , respectivement. Je n'ai pas réussi à implémenter la contrainte sur les valeurs de domaine; x_ {1} + x_ {2} = n , donc je suis un peu perplexe.n=5p1=0,1p2=0,9n=5p1=0,4p2=0,6X1+X2=n

Une visualisation produite dans n'importe quel langage ferait l'affaire (R, MATLAB, etc.), mais je travaille dans LaTeX avec TikZ / PGFPLOTS.

Premier essai

n=5 , p1=0,1 et p2=0,9

entrez la description de l'image ici

Deuxième essai

n=5 , p1=0,4 et p2=0,6

entrez la description de l'image ici

Éditer:

Pour référence, voici un article contenant quelques graphiques. Le titre de l'article est "Une nouvelle distribution binomiale bivariée" par Atanu Biswasa et Jing-Shiang Hwang. Statistiques et lettres de probabilité 60 (2002) 231–240.

Edit 2: Pour plus de clarté, et en réponse à @GlenB dans les commentaires, voici un instantané de la façon dont la distribution m'a été présentée dans mon livre. Le livre ne fait pas référence aux cas dégénérés / non dégénérés et ainsi de suite. Il le présente simplement comme ça et j'ai cherché à le visualiser. À votre santé! En outre, comme l'a souligné @JohnK, il y aura probablement une faute de frappe en ce qui concerne x1 + x1 = 1, ce qui, selon lui, devrait être x1 + x1 = n.

entrez la description de l'image ici

Image de l'équation de:

Spanos, A (1986) Fondements statistiques de la modélisation économétrique. la presse de l'Universite de Cambridge

Graeme Walsh
la source
5
Mais cela ne devrait pas être continu, non? Les deux variables aléatoires sont discrètes.
JohnK
1
Donc x1 et x2 sont indépendants, n'est-ce pas? Vous avez besoin d'un tracé pseudo-3D? Une carte thermique serait-elle acceptable?
gung - Rétablir Monica
1
quelque chose comme ça ?
Antoni Parellada
2
X1+X2=np1+p2=1X1Binomial(n,p1)X2n-X1
3
Vous n'avez pas de spécification pour un binôme bivarié dans votre question. (Il existe plusieurs façons de spécifier une distribution bivariée qui pourrait vraisemblablement être appelée "binomiale". Vous n'en avez aucune, bien que votre dégénérée soit un cas spécial pour certaines d'entre elles.) ... les dessins de votre référence Biswasa & Hwang ne sont pas des affichages appropriés d'un pmf bivarié discret. En bref, votre question n'a rien à dessiner et votre référence est utile principalement comme exemple de ce qu'il faut éviter.
Glen_b -Reinstate Monica

Réponses:

8

Il y a deux éléments à cela: vous devez d'abord déterminer quelles sont les probabilités individuelles, puis vous devez les tracer d'une manière ou d'une autre.

nje=nj=506×6=36

Nous pouvons d'abord calculer les PMF binomiaux marginaux, car c'est tellement simple. Comme les variables sont indépendantes, chaque probabilité conjointe ne sera que le produit des probabilités marginales; c'est l'algèbre matricielle. Ici, je montre ce processus en utilisant du Rcode:

b1 = dbinom(0:5, size=5, prob=0.1);  sum(b1)  # [1] 1
b9 = dbinom(0:5, size=5, prob=0.9);  sum(b9)  # [1] 1
b4 = dbinom(0:5, size=5, prob=0.4);  sum(b4)  # [1] 1
b6 = dbinom(0:5, size=5, prob=0.6);  sum(b6)  # [1] 1

b19 = b1%o%b9;  sum(b19)  # [1] 1
rownames(b19) <- colnames(b19) <- as.character(0:5)
round(b19, 6)
#       0        1        2        3        4        5
# 0 6e-06 0.000266 0.004783 0.043047 0.193710 0.348678
# 1 3e-06 0.000148 0.002657 0.023915 0.107617 0.193710
# 2 1e-06 0.000033 0.000590 0.005314 0.023915 0.043047
# 3 0e+00 0.000004 0.000066 0.000590 0.002657 0.004783
# 4 0e+00 0.000000 0.000004 0.000033 0.000148 0.000266
# 5 0e+00 0.000000 0.000000 0.000001 0.000003 0.000006
b46 = b4%o%b6;  sum(b46)  # [1] 1
rownames(b46) <- colnames(b46) <- as.character(0:5)
round(b46, 3)
#       0     1     2     3     4     5
# 0 0.001 0.006 0.018 0.027 0.020 0.006
# 1 0.003 0.020 0.060 0.090 0.067 0.020
# 2 0.004 0.027 0.080 0.119 0.090 0.027
# 3 0.002 0.018 0.053 0.080 0.060 0.018
# 4 0.001 0.006 0.018 0.027 0.020 0.006
# 5 0.000 0.001 0.002 0.004 0.003 0.001

À ce stade, nous avons les deux matrices de probabilités requises. Nous avons juste besoin de décider comment nous voulons les tracer. Pour être honnête, je ne suis pas un grand fan des graphiques à barres 3D. Parce qu'il Rsemble être d'accord avec moi, j'ai fait ces tracés dans Excel:

b19:

entrez la description de l'image ici

b46:

entrez la description de l'image ici

gung - Réintégrer Monica
la source
Merci pour la présentation plus le code R. Cela m'amène à poser des questions sur x1 + x2 = n. Si cette condition est remplie, ne devrait-il y avoir qu'une seule ligne de piliers comme présenté ici: reference.wolfram.com/language/ref/MultinomialDistribution.html Le graphique wolfram, je suppose, est ce que @Glen_b a appelé cas dégénéré? Est-ce à dire que vous avez présenté le cas non dégénéré?
Graeme Walsh
1
GraemeWalsh, ma présentation ne montre pas de binôme bivarié où x1 + x2 = n. Comme @Glen_b en a beaucoup parlé dans les commentaires et sa réponse, je n'appellerais pas vraiment cela une "distribution binomiale bivariée" sans la qualifier. De plus, cela signifierait que x1 et x2 ne sont pas indépendants, comme vous l'avez dit dans votre commentaire de réponse, mais parfaitement dépendants. En vérité, je n'ai pas remarqué que c'était une variante si bizarre (vous pouvez me reprocher de ne pas avoir lu assez attentivement). Comme l'a montré Glen_b, cette version serait une seule ligne de piliers. Ce que j'ai présenté était le cas non dégénéré.
gung - Réintégrer Monica
@gung J'aime tes nouvelles parcelles. Je pense que votre discussion couvre très bien le cas dégénéré ("vous devez comprendre quelles sont les probabilités individuelles" dit vraiment tout; les calculs réels pour le cas dégénéré sont triviaux); Je viens de faire ces calculs triviaux.
Glen_b -Reinstate Monica
7

La réponse de Gung est une bonne réponse pour un binôme bivarié réel, expliquant bien les problèmes (je recommanderais de l'accepter comme une bonne réponse à la question du titre, très probablement utile aux autres).

X1n

Définissons donc les choses correctement. Notez qu'aucune définition de la variable aléatoire n'est réellement proposée, nous nous retrouvons donc avec des hypothèses.

Oui1binomial(n,p1),P(Oui1=y1)y1y1=0,1,...,nX1=Oui1/nX1=0,16,26,...,1

P(X1=X1)X2=n-X1p2=1-p1

n=6,p1=0,3

entrez la description de l'image ici

X2X11-X1X2

Nous pourrions le considérer comme un binôme bivarié dégénéré (à l'échelle):

entrez la description de l'image ici

mais c'est un peu exagéré d'appeler vraiment ce qui est défini dans le livre un binôme bivarié (puisqu'il s'agit en fait d'un binôme univarié).

En supposant que quelqu'un veuille générer un tracé similaire à celui en 3D, ce petit morceau de code (R) se rapproche assez du deuxième tracé ci-dessus:

y = 0:6
x1 = y/6
x2 = 1-x1
p = dbinom(y,6,.3)
scatterplot3d(x1,x2,p,grid=TRUE, box=FALSE, cex.lab=1.2,
        color=3, cex.main=1.4,pch=21,bg=1,, type="h",angle=120,
        main="degenerate scaled binomial", ylab="x2", xlab="x1", 
        zlab="prob")

(Vous avez besoin du scatterplot3dpackage qui contient la fonction du même nom.)

Un binôme bivarié "vrai" (non dégénéré) a une variation dans les deux variables à la fois. Voici un exemple d'un type particulier de binôme bivarié (non indépendant dans ce cas). J'ai eu recours à différentes couleurs dans l'intrigue car il est trop facile de se perdre dans la forêt des "bâtons" sinon.

entrez la description de l'image ici

Xpoubelle(n0,p)Ouipoubelle(ny,p)Zpoubelle(nz,p)X1=X+OuiX2=X+Z

X1X2

n0nynz=XX1=X2X1+X2=n

[1]: Hamdan, MA (1972),
"Expansion canonique de la distribution binomiale bivariée avec des indices marginaux inégaux"
Revue statistique internationale , 40 : 3 (décembre), pp. 277-280

Glen_b -Reinstate Monica
la source
corr(X1,X2)=-1
Glen_b. Merci beaucoup. Souligner que l'objet mathématique que j'ai présenté (qui m'a été présenté!) Est un binôme bivarié dégénéré (à l'échelle) a été très utile! Je ne le savais pas depuis le début. Enfin, une requête élémentaire! Serait-il possible pour vous d'être explicite (par le biais de la notation mathématique) sur la façon dont vous définissez un binôme bivarié vrai ou réel? Ce serait utile, je pense.
Graeme Walsh
1
Xpoubelle(n0,p)Ouipoubelle(ny,p)Zpoubelle(nz,p)X1=X+OuiX2=X+Z
1
X1X2 qui sont corrélés mais a l'inconvénient de ne pas produire de corrélations négatives, donc ce n'est pas aussi utile que certaines autres formulations de binôme bivarié pour la modélisation bivariée générale. Généralement, lorsque vous généralisez une famille de distribution univariée en une famille bivariée, vous devez choisir les propriétés que vous souhaitez le plus et celles que vous pouvez vous permettre d'abandonner, et ces choix conduiront à différents choix de familles bivariées. [La distribution normale est inhabituelle - il y a une généralisation "évidente" avec à peu près tout ce que nous voulons.]
Glen_b -Reinstate Monica
@Graeme ... Je prévois d'ajouter plus de détails.
Glen_b -Reinstate Monica
4

Mathematicaest maintenant assez fort dans de telles choses - il a la solution de votre problème directement dans la documentation . Avec de petits ajouts, j'ai créé un modèle pour jouer (avec p = p1 = 0.4pour une meilleure présentation visuelle). Voilà à quoi ressemble l'interface et comment elle peut être contrôlée.

entrez la description de l'image ici

Fragment

Manipulate[
 Grid[{
   {DiscretePlot3D[
     PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right],

    DiscretePlot3D[
     CDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right]}
   }]
 ,
 {{n, 5}, 1, 20, 1, Appearance -> "Labeled"},
 {{p, 0.4}, 0.1, 0.9},
 TrackedSymbols -> True
 ]

L'essentiel ici est PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], ce qui est auto-explicatif, je pense. Multinomialsignifie simplement que vous pouvez prendre beaucoup de distributions avec chacune pipour la variable respective. La forme simple est BinomialDistribution. Bien sûr, je pourrais le faire manuellement, mais la règle est que si vous avez une fonction intégrée - vous devez l'utiliser.

Si vous avez besoin de quelques commentaires sur la structure du code, faites-le moi savoir.

garej
la source