Construire un rv discret ayant comme support toutes les logiques de

19

C'est la suite constructiviste de cette question .

Si nous ne pouvons pas avoir une variable aléatoire uniforme discrète ayant comme support tous les rationnels dans l'intervalle , alors la meilleure chose suivante est: [0,1]

Construisez une variable aléatoire qui a ce support, , et qui suit une certaine distribution. Et l'artisan en moi exige que cette variable aléatoire soit construite à partir de distributions existantes, plutôt que créée en définissant abstraitement ce que nous désirons obtenir.QQQ[0,1]

J'ai donc trouvé ce qui suit:

Soit une variable aléatoire discrète suivant la distribution géométrique-Variant II avec le paramètre , à savoirX0<p<1

X{0,1,2,...},P(X=k)=(1p)kp,FX(X)=1(1p)k+1

Soit également une variable aléatoire discrète suivant la distribution géométrique-Variant I avec un paramètre identique , à savoirYp

Y{1,2,...},P(Y=k)=(1p)k1p,FY(Y)=1(1p)k

X et Y sont indépendants. Définissez maintenant la variable aléatoire

Q=XY

et considérons la distribution conditionnelle

P(Qq{XY})

En termes lâches "conditionnel Q est le rapport de X sur Y conditionnel à ce que X soit plus petit ou égal à Y ". Le support de cette distribution conditionnelle est {0,1,1/2,1/3,...,1/k,1/(k+1),...,2/3,2/4,...}=Q[0,1] .

La «question» est la suivante: quelqu'un peut-il fournir la fonction de masse de probabilité conditionnelle associée?

Un commentaire demandait "devrait-il être fermé"? Étant donné que ce qui constitue une forme fermée de nos jours n'est pas si clair, permettez-moi de le dire ainsi: nous recherchons une forme fonctionnelle dans laquelle nous pouvons saisir un nombre rationnel à partir de [0,1] , et obtenir la probabilité (pour certains valeur spécifiée du paramètre p bien sûr), conduisant à un graphique indicatif du pmf. Et puis faites varier p pour voir comment le graphique change.

Si cela aide, alors nous pouvons ouvrir l'une ou les deux limites du support, bien que ces variantes nous priveront de la possibilité de représenter graphiquement les valeurs supérieures et / ou inférieures du pmf . De plus, si nous ouvrons la borne supérieure, alors nous devrions considérer l'événement de conditionnement .{X<Y}

Alternativement, je salue également les autres VR qui ont ce (s) support (s), tant qu'ils se réunissent avec leur pmf .

J'ai utilisé la distribution géométrique car elle a facilement deux variantes disponibles avec celle qui n'inclut pas zéro dans le support (de sorte que la division par zéro est évitée). De toute évidence, on peut utiliser d'autres RV discrets, en utilisant une troncature.

Je mettrai certainement une prime sur cette question, mais le système ne le permet pas immédiatement.

Alecos Papadopoulos
la source
1
Voulez-vous dire ? (définir une variable aléatoire conditionnellement sur quelque chose n'a aucun sens, vous ne pouvez définir sa distribution que de cette façon)Q=XY1{XY}
Stéphane Laurent
1
Votre Q est dénombrable: vous savez qu'il existe une correspondance 1-1 entre N = {1, 2, ...} et Q. Si vous pouviez trouver une telle correspondance, la solution serait de choisir n'importe quelle distribution sur N et de l'utiliser choisir l'élément correspondant de Q.
Adrian
de toute façon vous devez calculer pour chaque fraction irréductible et ceci est . p / q Pr ( X = p , X = 2 p , )Pr(X/Y=p/q)p/qPr(X=p,X=2p,)×Pr(Y=q,Y=2q,)
Stéphane Laurent
1
L'obligation de fournir le pmf signifie-t-elle qu'un formulaire fermé est requis? Ou, par exemple, la somme infinie de @ StéphaneLaurent est-elle suffisante pour remplir la condition?
Juho Kokkala
1
Soit et Y le RV dans votre message. P r [ Q = q ] = P r [ Y = f - 1 ( q ) ]F:NQ[0,1]Pr[Q=q]=Pr[Oui=F-1(q)]
Adrian

Réponses:

19

Considérons la distribution discrète avec support sur l'ensemble avec des masses de probabilité{ ( p , q )F{(p,q)|qp1}N2

F(p,q)=321+p+q.

Ceci est facilement additionné (toutes les séries impliquées sont géométriques) pour démontrer qu'il s'agit vraiment d'une distribution (la probabilité totale est l'unité).

Pour tout nombre rationnel non nul soit sa représentation en termes les plus bas: c'est-à-dire et .a / b = x b > 0 pgcd ( a , b ) = 1Xune/b=Xb>0gcd(une,b)=1

G [ 0 , 1 ] QF induit une distribution discrète sur via les règlesg[0,1]Q

g(X)=g(uneb)=n=1F(unen,bn)=321+une+b-2.

(et ). Chaque nombre rationnel dans a une probabilité non nulle. (Si vous devez inclure parmi les valeurs avec une probabilité positive, retirez simplement une partie de la probabilité d'un autre nombre - comme - et affectez-la à ).( 0 , 1 ] 0 1 0g(0)=0(0,1]010

Pour comprendre cette construction, regardez cette représentation de :F

[Figure de F]

p , q F p / q p q 0 1 G G G ( 1 ) 1 F ( 1 , 1 ) + F ( 2 , 2F donne des masses de probabilité en tous les points avec des coordonnées entières positives. Les valeurs de sont représentées par les zones colorées des symboles circulaires. Les lignes ont des pentes pour toutes les combinaisons possibles de coordonnées et apparaissant dans le tracé. Ils sont colorés de la même manière que les symboles circulaires sont: selon leurs pentes. Ainsi, la pente (qui va clairement de à ) et la couleur correspondent à l' argument de et les valeurs de sont obtenues en additionnant les zones de tous les cercles se trouvant sur chaque ligne. Par exemple,p,qFp/qpq01ggg(1)est obtenu en additionnant les aires de tous les cercles (rouges) le long de la diagonale principale de la pente , donnée par = .13 / huit + 3 / 32 + 3 / 128 + = une / 2F(1,1)+F(2,2)+F(3,3)+3/8+3/32+3/128+=1/2

Figure

Cette figure montre une approximation de obtenue en limitant : elle trace ses valeurs à nombres rationnels allant de à . Les masses de probabilité les plus importantes sont .q 100 3 044 1 / 100 1 1Gq10030441/100112,314,110,362,362,142,

Voici le CDF complet de (précis à la résolution de l'image). Les six nombres qui viennent d'être énumérés donnent la taille des sauts visibles, mais chaque partie du CDF est constituée de sauts, sans exception:g

Figure 2

whuber
la source
1
Merci! Je suis en train de comprendre la construction. Juste deux questions: a) est bivarié, mais dans l'expression le liant à il apparaît comme univarié. Suis-je en train de manquer quelque chose? et b) Puisque est univarié, je suppose que tous les points du premier graphique à l'aspect impressionnant représentent une valeur différente sur l'axe horizontal (bien que cela ne puisse bien sûr pas être fidèlement représenté sur une telle échelle), ai-je raison? FGGG
Alecos Papadopoulos
Je venais de terminer un chiffre qui pourrait répondre à votre commentaire, Alecos, et je l'ai ajouté à la réponse. Notez que j'aurais pu commencer avec n'importe quelle distribution discrète et construire de la même manière; cette distribution particulière a été choisie pour faciliter les calculs. GFg
whuber
De mieux en mieux, comme pour ma première question dans le commentaire précédent, devrait-il être au lieu de ? C'est-à-dire que et ? F(aF(ab,n)p=a/bq=nF(abn)p=une/bq=n
Alecos Papadopoulos
C'est une meilleure réponse que la mienne! J'ai remarqué deux petites choses: je pense que votre F (p, q) somme à 4 comme écrit. Toujours dans l'équation ci-dessous "F induit une distribution discrète G" vous devriez avoir F (na, nb) non?
Adrian
@Adrian, Alecos Merci d'avoir attrapé ces fautes de frappe: le devrait être un et la notation pour est évidemment incorrecte. Je vais les réparer tout de suite. - 1 F11F
whuber
8

Je vais rassembler mes commentaires et les poster comme réponse juste pour plus de clarté. J'espère que vous ne serez pas très satisfait, cependant, car je ne fais que réduire votre problème à un autre.

Ma notation:

QQ est un RV dont le support est - mon n'est pas le même que le l'OP construit à partir de son . Nous définirons ce utilisant et , que je présente ci-dessous. Q Q XQ[0,1]QQ QYfXYQYf

Y est tout RV dont le support est - le donné par l'OP fonctionnerait, par exemple. YN{1,2,}Y

f : Nf est une correspondance biunivoque et est son inverse. Nous savons qu'ils existent.f - 1f:NQ[0,1]f1

Maintenant, je prétends que je peux réduire votre problème à simplement trouver un et son :f - 1ff1

Laissez simplement et vous avez terminé. La PMF de est . Q Pr [ Q = q ] = Pr [ Y = f - 1 ( q ) ]Q=f(Y)QPr[Q=q]=Pr[Y=f1(q)]

Éditer:

Voici une fonction g qui joue le rôle de , bien qu'il ne s'agisse pas d'une correspondance biunivoque (à cause des doublons):f

g <- function(y) {
    y <- as.integer(y)
    stopifnot(y >= 1)
    b <- 0
    a <- 0
    for (unused_index in seq(1, y)) {
        if (a >= b) {
            b <- b+1
            a <- 0
        } else {
            a <- a+1
        }
    }
    return(sprintf("q = %s / %s", a, b))
    ## return(a / b)
}
Adrian
la source
(+1) Non, je considère que votre approche est un excellent exemple de la façon dont on peut penser et utiliser l'approche abstraite afin d'arriver à des résultats et des algorithmes très applicables . Le point principal tel que je le comprends maintenant, est que l'on peut obtenir la construction souhaitée en utilisant comme forme fonctionnelle le pmf de toute distribution discrète ayant le support . Bien sûr, il reste à trouver et . Puisque vous avez une meilleure compréhension de cette approche que moi, la phrase "nous savons qu'ils existent" est une façon polie de dire "mais nous n'avons aucune idée de leur apparence"? :)N{1,2,}ff1
Alecos Papadopoulos
Voir jcu.edu/math/vignettes/infinity.htm : vous pouvez utiliser un "motif diagonal" similaire. La partie difficile est d'obtenir une expression pour . Je ne sais pas comment faire cela, mais vous pouvez demander sur math.stackexchange.com (ou faire un peu plus de recherche en premier). F-1
Adrian
Dans le lien que vous avez fourni, il est dit à un moment donné: "Notez qu'il n'est pas nécessaire de trouver une formule pour la correspondance; tout ce qui est nécessaire est la certitude qu'une telle correspondance existe. Il existe de nombreux autres exemples en mathématiques qui ressemblent à ceci - où il s'agit de montrer que quelque chose doit arriver ou que quelque chose existe, plutôt que d'exposer une formule. Eh bien, le point dans ma question est en fait d'exposer une formule : j'ai appelé cette question "constructiviste" pour une raison.
Alecos Papadopoulos
1
Je pense que je peux fournir un algorithme qui fonctionnerait - j'y penserai un peu plus.
Adrian
J'ai publié quelque chose - vous permet de simuler Q, mais ne résout pas le problème PMF.
Adrian