Exemple de construction montrant

12

Comment construire un exemple de distribution de probabilité pour laquelle est valable, en supposant que ?E(1X)=1E(X)P(X0)=1

L'inégalité qui découle de l'inégalité de Jensen pour un RV valeur positive est comme (l'inégalité inverse si ). En effet, le mappage est convexe pour et concave pour . En suivant la condition d'égalité dans l'inégalité de Jensen, je suppose que la distribution doit être dégénérée pour que l'égalité requise soit maintenue. Un cas trivial où l'égalité tient est bien sûr si ae Voici un exemple que j'ai trouvé dans un livre de problèmes: Considérons une variable aléatoire discrète telle queXE(1X)1E(X)X<0x1xx>0x<0X=1XP(X=1)=19,P(X=12)=P(X=2)=49 . Il est ensuite facile de vérifier que .E(1X)=1E(X)=1

Cet exemple montre que n'a pas besoin d'être positif (ou négatif) ae pour que l'égalité dans le titre soit valable. La distribution ici n'est pas non plus dégénérée.X

Comment puis-je construire un exemple, peut-être comme celui que j'ai trouvé dans le livre? Y a-t-il une motivation?

TêtuAtom
la source
Votre exemple est valable pour toute variable aléatoire qui est une constante non nulle. Votre deuxième exemple n'est pas non plus dégénéré.
Michael R. Chernick
3
L'inégalité ne découle pas de l'inégalité de Jensen sans supposer davantage que est presque sûrement positif. X
whuber
@MichaelChernick Je n'ai pas laissé entendre que l'exemple avait une distribution dégénérée.
StubbornAtom
Je faisais référence à votre déclaration "En respectant la condition d'égalité dans l'inégalité de Jensen, je suppose que la distribution doit être dégénérée pour que l'égalité requise soit respectée." Pourtant, vous avez montré un exemple non dégénéré.
Michael R. Chernick
1
@whuber Je veux simplement savoir comment trouver un exemple où l'égalité dans le titre est vraie.
StubbornAtom

Réponses:

18

Construisons tous les exemples possibles de variables aléatoires pour lesquelles . Ensuite, parmi eux, nous pouvons suivre quelques heuristiques pour obtenir l' exemple le plus simple possible. Ces heuristiques consistent à donner les valeurs les plus simples possibles à toutes les expressions qui sortent d'une analyse préliminaire. Cela s'avère être l'exemple du manuel.E [ X ] E [ 1 / X ] = 1XE[X]E[1/X]=1

Analyse préliminaire

Cela nécessite seulement un peu d'analyse basée sur les définitions. La solution n'a qu'un intérêt secondaire: l'objectif principal est de développer des idées pour nous aider à comprendre intuitivement les résultats.

Observons d'abord que l'inégalité de Jensen (ou l'inégalité de Cauchy-Schwarz) implique que pour une variable aléatoire positive , , avec égalité si et seulement si est "dégénéré": que est, est presque sûrement constant. Lorsque est une variable aléatoire négative, est positif et le résultat précédent tient avec le signe d'inégalité inversé. Par conséquent, tout exemple où doit avoir une probabilité positive d'être négative et une probabilité positive d'être positive.E [ X ] E [ 1 / X ] 1 X X X - X E [ 1 / X ] = 1 / E [ X ]XE[X]E[1/X]1XXXXE[1/X]=1/E[X]

L'idée ici est que tout avec doit en quelque sorte «équilibrer» l'inégalité de sa partie positive contre l'inégalité dans l'autre sens de sa partie négative. Cela deviendra plus clair au fur et à mesure.E [ X ] E [ 1 / X ] = 1XE[X]E[1/X]=1

Considérons une variable aléatoire non nulle . Une première étape dans la formulation d'une définition de l'attente (au moins lorsque cela est fait en généralité en utilisant la théorie des mesures) consiste à décomposer en ses parties positives et négatives, qui sont toutes deux des variables aléatoires positives:XXX

Y=Positive part(X)=max(0,X);Z=Negative part(X)=min(0,X).

Imaginons comme un mélange de de poids et de poids où Il est évident Cela nous permettra d'écrire les attentes de et en fonction des attentes des variables positives et .Y p - Z 1 - p p = Pr ( X > 0 ) , 1 - p = Pr ( X < 0 ) . 0 < p < 1. X 1 / XXYpZ1p

p=Pr(X>0), 1p=Pr(X<0).
0<p<1.
X1/XZYZ

Pour simplifier un peu l'algèbre à venir, notez que le redimensionnement uniforme de par un nombre ne change pas mais il multiplie et chacun par . Pour positif , cela revient simplement à sélectionner les unités de mesure de . Un négatif commute les rôles de et . En choisissant le signe de manière appropriée, nous pouvons donc supposer queσ E [ X ] E [ 1 / X ] E [XσE[X]E[1/X]E [ Z ] σ σ X σ Y Z σ E [ Z ] = 1  et  E [ Y ] E [ ZE[Y]E[Z]σσXσYZσ

(1)E[Z]=1 and E[Y]E[Z].

Notation

Voilà pour les simplifications préliminaires. Pour créer une jolie notation, écrivons donc

μ=E[Y]; ν=E[1/Y]; λ=E[1/Z]

pour les trois attentes que nous ne pouvons pas contrôler. Les trois quantités sont positives. L'inégalité de Jensen affirme

(2)μν1 and λ1.

La loi de probabilité totale exprime les attentes de et en termes de quantités que nous avons nommées:1 / XX1/X

E[X]=E[XX>0]Pr(X>0)+E[XX<0]Pr(X<0)=μp(1p)=(μ+1)p1

et comme a le même signe que ,X1/XX

E[1X]=E[1XX>0]Pr(X>0)+E[1XX<0]Pr(X<0)=νpλ(1p)=(ν+λ)pλ.

L'égalisation du produit de ces deux expressions avec fournit une relation essentielle entre les variables:1

(*)1=E[X]E[1X]=((μ+1)p1)((ν+λ)pλ).

Reformulation du problème

Supposons que les parties de - et --existe - t des variables aléatoires positives (dégénérées ou non). Cela détermine et . Quand peut-on trouver , avec , pour lequel est valable?Y Z μ , ν , λ p 0 < p < 1 ( )XYZμ,ν,λp0<p<1()

Cette articule clairement le « équilibre » aperçu précédemment déclaré que vaguement: nous allons tenir et fixe et l' espoir de trouver une valeur de qui concilie de façon appropriée leurs contributions par rapport à . Bien qu'il ne soit pas immédiatement évident qu'un tel besoin existe, ce qui est clair, c'est qu'il ne dépend que des moments , , et . Le problème est ainsi réduit à une algèbre relativement simple - toute l'analyse des variables aléatoires est terminée.Yp X p E [ Y ] E [ 1 / Y ] E [ Z ] E [ 1 / Z ]ZpXpE[Y]E[1/Y]E[Z]E[1/Z]

Solution

Ce problème algébrique n'est pas trop difficile à résoudre, car est au pire une équation quadratique pour et les inégalités gouvernantes et sont relativement simples. En effet, nous indique que le produit de ses racines et estp ( 1 ) ( 2 ) ( ) p 1 p 2()p(1)(2)()p1p2

p1p2=(λ1)1(μ+1)(ν+λ)0

et la somme est

p1+p2=(2λ+λμ+ν)1(μ+1)(ν+λ)>0.

Par conséquent, les deux racines doivent être positives. De plus, leur moyenne est inférieure à , car1

1(p1+p2)2=λμ+ν+2μν2(μ+1)(ν+λ)>0.

(En faisant un peu d'algèbre, il n'est pas difficile de montrer que la plus grande des deux racines ne dépasse pas non plus.)1

Un théorème

Voici ce que nous avons trouvé:

Compte tenu des deux variables aléatoires positives et (au moins un est non dégénérée) pour lequel , , et existent et sont finies. Il existe alors une ou deux valeurs , avec , qui déterminent une variable de mélange de poids pour et de poids pour et pour laquelle . Chaque telle instance d'une variable aléatoire avec est de cette forme.Z E [ Y ] E [ 1 / Y ] E [ Z ] E [ 1 / Z ] p 0 < p < 1 X p Y 1 - p - Z E [ X ] EYZE[Y]E[1/Y]E[Z]E[1/Z]p0<p<1XpY1pZX E [ X ] E [ 1 / X ] = 1E[X]E[1/X]=1XE[X]E[1/X]=1

Cela nous donne en effet un riche ensemble d'exemples!


Construire l'exemple le plus simple possible

Après avoir caractérisé tous les exemples, procédons à la construction d'un exemple aussi simple que possible.

  • Pour la partie négative , choisissons une variable dégénéréeZ - le type de variable aléatoire le plus simple. Il sera mis à l'échelle pour prendre sa valeur , d'où . La solution de inclut , la réduisant à une équation linéaire facilement résolue: la seule racine positive est1λ=1()p1=0

    (3)p=11+μ+11+ν.
  • Pour la partie positive , nous n'obtenons rien d'utile si est dégénéré, nous allons donc lui donner une probabilité à seulement deux valeurs positives distinctes , disons . YYa<bPr(X=b)=q Dans ce cas, la définition de l'attente donne

    μ=E[Y]=(1q)a+qb; ν=E[1/Y]=(1q)/a+q/b.
  • Pour rendre cela encore plus simple, rendons et identiques:Y1/Y cela force et . Maintenantq=1q=1/2a=1/b

    μ=ν=b+1/b2.

    La solution simplifie(3)

    p=21+μ=42+b+1/b.
  • Comment faire en sorte que cela implique des chiffres simples? Puisque et , nécessairement . Choisissons le nombre le plus simple supérieur à pour ; à savoir, . La formule précédente donne et notre candidat pour l'exemple le plus simple possible est donca<bab=1b>11bb=2p=4/(2+2+1/2)=8/9

    Pr(X=2)=Pr(X=b)=Pr(Y=b)p=qp=1289=49;Pr(X=1/2)=Pr(X=a)=Pr(Y=a)p=qp==49;Pr(X=1)=Pr(Z=1)(1p)=1p=19.

C'est l'exemple même proposé dans le manuel.

whuber
la source
2
Bonne réponse. Malgré mon scepticisme initial, il est facile de trouver un exemple avec des solutions distinctes . p(0,1)
P.Windridge
8

Comme vous l'avez mentionné, si est positif, alors ne se produit que lorsque est presque sûrement constant. Sinon, vous avez besoin de pour prendre des valeurs négatives et positives.XE(1/X)=1/E(X)XX

Pour construire un tel exemple, commencez par être aussi simple que possible. Supposons que prend deux valeurs, et , avec les probabilités et respectivement. Alors et Pour avoir nous avons besoin de qui se réorganise selon l'exigence Cela signifie que la seule solution possible doit avoir , ou , ou . Dans tous les cas, nous revenons au cas dégénéré: est constant.Xabp1p

E(X)=ap+b(1p)
E(1/X)=1ap+1b(1p).
1/E(X)=E(1/X)
ap+b(1p)=11ap+1b(1p)
(ab)2p(1p)=0.
a=bp=0p=1X

Essayez ensuite: une distribution avec trois valeurs possibles. Ici, il y a beaucoup plus de choix. L'exemple que vous avez cité essaie un tel que ait la même distribution. Si nous savons que prend trois valeurs, cela doit être que l'une des valeurs est soit soit , et les deux autres doivent être et pour un choix de . Pour être précis, essayons , et . Alors Pour répondre à l'exigence nous demandons ouX1/XX11a1/aaP(X=a)=P(X=1/a)=pP(X=1)=12p

(1)E(1/X)=E(X)=(a+1a)p(12p)=(2+a+1a)p1.
1/E(X)=E(1/X)E(X)=1E(X)=1. L'expression (1) n'est jamais sauf si , ce qui nous renvoie à nouveau au cas dégénéré. Donc, visez , ce qui donne Expression (2) donne toute une famille de solutions qui répondent à l'exigence. La seule contrainte est que doit être positif. L'exemple que vous avez cité prend . Seul le cas est dégénéré.1p=0E(X)=1aa=2a=1
(2)(2+a+1a)p=2p=22+a+1a=2a(a+1)2.
aa=2a=1
grand_chat
la source
1
Je suppose que votre première ligne est destinée à être "si est positif, alors ne se produit que lorsque est presque sûrement constant", comme dans la question . Cela découle de (la preuve de) l'inégalité de Jensen, où nous utilisons également le fait que n'est pas linéaire. E [ 1 / X ] = 1 / E [ X ] X h ( x ) = 1 / xXE[1/X]=1/E[X]Xh(x)=1/x
P.Windridge
@ P.Windridge Vous avez raison! Fixé.
grand_chat