Comment prouver si la moyenne d'une fonction de densité de probabilité existe

9

Il est bien connu qu’étant donné une variable aléatoire de valeur réelle X avec pdf F, la moyenne de X (s'il existe) est trouvé par

E[X]=RXF(X)X.

Question générale: maintenant, si l'on ne peut pas résoudre l'intégrale ci-dessus sous forme fermée, mais veut simplement déterminer si la moyenne existe et est finie, existe-t-il un moyen de le prouver? Existe-t-il (peut-être) un test que je peux appliquer à l'intégrande pour déterminer si certains critères sont remplis pour que la moyenne existe?

Question spécifique à l'application: J'ai le pdf suivant pour lequel je veux déterminer si la moyenne existe:

F(X)=|σ22μ1X+μ2σ12|σ13σ23une3(X)ϕ(μ2X-μ1σ1σ2une(X))pour XR,

μ1,μ2R, σ1,σ2>0, une(X)=(X2σ12+1σ22)1/2, et ϕ(g(X))=12πe-g2(X)/2.

J'ai essayé de résoudre le problème en vain.

Aaron Hendrickson
la source
1
dans votre question spécifique F(X)n'est pas une fonction de densité appropriée. supposerμ1=1, μ2=0 et σj=1, j=1,2, puis F(X)<0 pour X<0.
EliKa
@EliKa Bonne trouvaille. Il peut y avoir une faute de frappe. Je vais vérifier et corriger la question. Cela dit, je suis toujours principalement intéressé par la partie «comment» de la question, c'est-à-dire comment pourrais-je déterminer si la moyenne existe et est finie?
Aaron Hendrickson
2
Vous pourriez essayer de délimiter |XF(X)| au-dessus et en dessous par quelques fonctions non négatives u(X) et b(X)de telle sorte que vous puissiez les intégrer. Si vous pouvez intégreru(X), alors votre distribution a une moyenne. Sib(x)dx=, votre distribution n'a aucun moyen.
Ceph
@Ceph C'est une bonne suggestion. Cette technique est-elle basée sur le "théorème de compression"?
Aaron Hendrickson
1
@AaronHendrickson Idée similaire, mais (si je comprends bien) le théorème de compression est un peu différent. L'utilisation de la ST ici pourrait ressembler à ceci: vous trouvezu(x) et b(x) cette limite xf(x) (plutôt que de délimiter |xf(x)| comme dans mon commentaire précédent) de sorte que vous pouvez trouver u(x)dx=b(x)dx=μ, où μest la moyenne de votre distribution. Mais ce n'est probablement pas une stratégie plausible, car vous auriez du mal à trouver de tellesu et b. (Ils peuvent différer dexf(x) que sur un ensemble de mesure 0 et ne serait donc probablement pas plus facile à intégrer que xf(x)est.)
Ceph

Réponses:

12

Il n'y a pas de technique générale, mais il existe des principes simples. L'une consiste à étudier le comportement de la queuef en le comparant à des fonctions exploitables.

Par définition, l'attente est la double limite (comme y et z varient indépendamment)

Ey,z[f]=limy,zyzxf(x)dx=limyy0xf(x)dx+limz0zxf(x)dx.

Le traitement des deux intégrales à droite est le même, alors concentrons-nous sur le positif. Un comportement def qui assure une valeur limite est de la comparer à la puissance xp. Supposerp est un nombre pour lequel

lim infxxpf(x)>0.
Cela signifie qu'il existe un ϵ>0 Et un N>1 Pour qui xpf(x)ϵ n'importe quand x[N,). Nous pouvons exploiter cette inégalité en rompant l'intégration dans les régions oùx<N et xN et l'appliquer dans la deuxième région:

0zxf(x)dx=0Nxf(x)dx+Nzxf(x)dx=0Nxf(x)dx+Nzx1p(xpf(x))dx0Nxf(x)dx+Nzx1p(ϵ)dx=0Nxf(x)dx+ϵ2p(z2pN2p).

À condition de p<2, le côté droit diverge comme z. Quandp=2 l'intégrale s'évalue au logarithme,

Nzx12(ϵ)dx=ϵ(log(z)log(N)),

qui diverge également.

Une analyse comparable montre que si |x|pf(x)0 pour p>2, puis E[X]existe. De même, nous pouvons tester si un moment deX existe: pour α>0, l'attente de |X|α existe quand |x|p+αf(x)0 pour certains p>1 et n'existe pas lorsque lim inf|x|p+αf(x)>0 pour certains p1. Cela répond à la «question générale».

Appliquons cette idée à la question. Par inspection, il est clair que a(x)|x|/σ1 pour grand |x|. En évaluantf, nous pouvons donc supprimer tous les termes supplémentaires qui seront éventuellement submergés par |x|. Ainsi, jusqu'à une constante non nulle, parx>0

f(x)μ1xσ2x3ϕ(μ2xσ2x)=x2μ1σ2exp((μ22σ2)2).

Donc x2f(x)s'approche d'une constante non nulle. Par le résultat précédent, l'attente diverge.

Depuis 2 est la plus petite valeur de p qui fonctionne dans cet argument--|x|pf(x) ira à zéro comme |x| pour toute p<2- c'est clair (et une analyse plus détaillée des fconfirmera) que le taux de divergence est logarithmique. Autrement dit, pour les grands|y| et |z|, Ey,z[f] peut être étroitement approché par une combinaison linéaire de log(|y|) et log(|z|).

whuber
la source