Somme des variables aléatoires exponentielles indépendantes

12

Pouvons-nous prouver un résultat de concentration net sur la somme des variables aléatoires exponentielles indépendantes, ie Soit des variables aléatoires indépendantes telles que . Soit . Pouvons-nous prouver des bornes de la forme . Cela suit directement si nous utilisons la forme de variance des limites de chernoff et donc je crois que c'est vrai, mais les limites que je lis nécessitent une limite ou ont une certaine dépendance sur la limite des variables. Quelqu'un pourrait-il me montrer une preuve de ce qui précède? X1,XrPr(Xi<x)=1ex/λiZ=XiPr(|ZμZ|>t)<et2/(λi)2

Harceler
la source
il suffit de suivre la preuve de chernoff: il est facile de délimiter le moment exponentiel des variables aléatoires exponentielles.
Sasho Nikolov
J'ai essayé de répéter la preuve de chernoff. Je l'ai fait pour le cas le plus simple où tout . Je peux obtenir le type de relation que je recherche dans une condition douce de . Une telle condition survient-elle naturellement ou est-elle due à ma mauvaise solution? λi=λt<nλ
NAG
3
Consultez Lemma 2.8 ici eprint.iacr.org/2010/076.pdf
Sasho Nikolov
Oui, cela a du sens. Même dans leur lemme ils ont une condition sur être assez petit. Bon alors ma solution semble correcte. Merci beaucoup pour les liens et la suggestion. t
NAG
1
@SureshVenkat fait. NAg, je pense qu'il y a des fautes de frappe dans votre question. Tout d'abord, est un CDF très impair pour positif . Voulez-vous dire ? Si vous l'avez fait, la variance est de la forme et votre borne chernoff ne semble pas tout à fait correcte. x Pr [ X i < x ] = 1 - e - λ i x λ - 2 iPr[Xi<x]=eλixxPr[Xi<x]=1eλixλi2
Sasho Nikolov

Réponses:

7

Pour être concret, disons que le pdf du rv estXi

p(Xi=x)=12λieλi|x|.

Il s'agit de la distribution de Laplace, ou la double distribution exponentielle. Sa variance est . Le cdf est2λi2

Pr[Xix]=112eλix
pour .x0

La fonction de génération de moment de estXi

E euXi=11u2/λi2,
pour . En utilisant ce fait et la méthode des moments exponentiels qui est standard dans la preuve des bornes de Chernoff, vous obtenez que pour et , l'inégalité suivante tient|u|<λiX=iXiσ2=2iλi2

Pr[X>tσ]<et2/4,
t 2 σ min i λ i tant que . Vous pouvez trouver une dérivation détaillée dans la preuve du lemme 2.8 de cet article .t2σminiλi

Sasho Nikolov
la source
Merci beaucoup pour la réponse. Cependant, dans mon application, il n'est pas nécessairement vrai que . Cependant, on s'attendrait à une concentration encore plus forte dans le cas . Nous pouvons obtenir un tel résultat si nous n'utilisons pas l'approximation de qui restreint la plage de dans la preuve mais l'analyse de cela devient ingérable dans le cas de différent . Des suggestions à ce sujet? t>t2σminiλi1/(1-x)e c x tλi st>2σminiλi1/(1x)ecxtλis
NAG
cela va être une agitation vigoureuse de la main, mais je m'attends à ce que de si grandes valeurs de soient plus susceptibles de se produire lorsque seul un petit nombre de dépasse la médiane depar beaucoup. mais les doubles variables exponentielles ont une queue plus lourde que les gaussiens, et un petit nombre d'entre elles ne peuvent pas se concentrer aussi étroitementX i | X i |XXi|Xi|
Sasho Nikolov
2
Je me rends compte que ce que j'ai écrit ci-dessus n'est pas clair: je m'attends à ce que cette sortie dans la queue ressemble à la queue d'un autre rv qui est la somme d'un petit nombre de double rv exponentielle La queue de ce ne devrait pas être sous-gaussien. X X XXX
Sasho Nikolov
3

Pour la distribution Laplace, si vous utilisez la borne de Bernoulli, vous pouvez écrire

σ2=2Σiλ - 2 i

EeuiXi=i11u2/λi211u2σ2/2,
où . Ensuite, la méthode classique de Chernoff donneσ2=2iλi2

Pr[iXitσ]1+1+2t22e11+2t2{(et/2+1)e2tet2/2+t4/8.

Notez que ces limites sont valables pour les valeurs illimitées de et . Les limites à droite montrent les deux régimes possibles. Pour les petites valeurs de nous obtenons une concentration «normale» , tandis que pour les grandes valeurs de nous obtenons , qui est également le CDF pour une seule variable distribuée Laplace.λ i t e - t 2 / 2 t e - tλitet2/2te2t

La borne vous permet d'interpoler entre les deux situations, mais je soupçonne que dans presque tous les cas, on sera fermement dans le grand ou le petit . tt11+2t2tt

Pour la distribution exponentielle, les mêmes techniques nous donnent où . D'où Donc, vous obtenez toujours quelque chose d' assez normal, mais avec plutôt que comme nous aurions pu l'espérer. Je ne sais pas s'il est possible d'obtenir une limite en termes de variance. Vous pouvez essayer d'étudier , mais cela ne semble pas être facile à travailler. μ=i1/λiPr[(iXi)-μtμ](t+1)2EeuiXi11uμμ=i1/λit μ t σ E e u ( X i - μ

Pr[(iXi)μtμ](t+1)etet2/2+t3/3.
tμtσEeu(Xiμ)2
Thomas Ahle
la source
Je n'ai pas le temps de travailler sur les détails mais je suis sûr à 99,9% que l'on peut obtenir une limite pour les variables aléatoires distribuées de façon exponentielle qui dépend de la variance. Votre fonction de génération du moment semble excessivement lâche.
Warren Schudy
@Warren Schudy, quelle serait votre approche?
Thomas Ahle
Je vois deux approches évidentes: 1. La deuxième borne répertoriée sur en.wikipedia.org/wiki/… semble que cela devrait fonctionner. 2. Trouvez une limite plus stricte sur la fonction de génération de moment.
Warren Schudy
@WarrenSchudy La borne de Bernstein donne , mais uniquement pour . Je suppose que cela est similaire à la réponse de Sasho. t σ min i λ i / 2Pr[iXitσ]et2/2tσminiλi/2
Thomas Ahle
Il est inévitable que les limites de style gaussien s'arrêtent à un moment donné. Même une seule variable aléatoire exponentiellement distribuée a finalement des queues plus grasses que n'importe quelle gaussienne.
Warren Schudy