Y a-t-il une borne inverse de Chernoff qui limite la probabilité de queue au moins autant.
c'est-à-dire si sont des variables aléatoires binomiales indépendantes et . Alors peut-on prouver pour une fonction .
pr.probability
chernoff-bound
Ashwinkumar BV
la source
la source
Réponses:
Voici une preuve explicite qu'une borne de Chernoff standard est serrée à des facteurs constants dans l'exposant pour une plage particulière de paramètres. (En particulier, chaque fois que les variables sont 0 ou 1, et 1 avec une probabilité de 1/2 ou moins, etϵ∈(0,1/2) , et que la limite supérieure de Chernoff est inférieure à une constante.)
Si vous trouvez une erreur, faites-le moi savoir.
Lemme 1. (serrage de la borne de Chernoff) SoitX la moyenne de k variables aléatoires indépendantes (0/1) (rv). Pour tout ϵ∈(0,1/2] et p∈(0,1/2] , en supposant ϵ2pk≥3 ,
(i) Si chaque rv est 1 avec une probabilité au plus , alorsp
(ii) Si chaque rv est 1 avec une probabilité d'au moins , alorsp
Preuve. Nous utilisons l'observation suivante:
Revendication 1. Si , alors1≤ℓ≤k−1 (kℓ) ≥ 1e2πℓ−−−√(kℓ)ℓ(kk−ℓ)k−ℓ
Preuve de revendication 1. Par approximation de Stirling, oùi!=2πi−−−√(i/e)ieλ λ∈[1/(12i+1),1/12i].
Ainsi, , qui est , est au moins QED(kℓ) k!ℓ!(k−ℓ)!
Preuve du lemme 1 partie (i). Sans perte de généralité, supposons que chaque variable aléatoire 0/1 dans la somme est 1 avec une probabilité exactement . Remarque est égal à la somme , et .X p Pr[X≤(1−ϵ)p] ∑⌊(1−ϵ)pk⌋i=0Pr[X=i/k] Pr[X=i/k]=(ki)pi(1−p)k−i
Fixez . Les termes dans la somme augmentent, donc les termes d'index ont chacun une valeur au moins , donc leur somme a une valeur totale au moins . Pour compléter la preuve, nous montrons queℓ=⌊(1−2ϵ)pk⌋+1 i≥ℓ Pr[X=ℓ/k] (ϵpk−2)Pr[X=ℓ/k]
Les hypothèses et donnent , donc le côté gauche ci-dessus est au moins . En utilisant la revendication 1, pour lier , c'est à son tour au moins où etϵ2pk≥3 ϵ≤1/2 ϵpk≥6 23ϵpk(kℓ)pℓ(1−p)k−ℓ (kℓ) AB A=23eϵpk/2πℓ−−−√ B=(kℓ)ℓ(kk−ℓ)k−ℓpℓ(1−p)k−ℓ.
Pour terminer, nous montrons et .A≥exp(−ϵ2pk) B≥exp(−8ϵ2pk)
Revendication 2.A≥exp(−ϵ2pk)
Preuve de revendication 2. Les hypothèses et impliquent (i) .ϵ2pk≥3 ϵ≤1/2 pk≥12
Par définition, . Par (i), . Ainsi, (ii) .ℓ≤pk+1 pk≥12 ℓ≤1.1pk
La substitution du côté droit de (ii) à dans donne (iii) .ℓ A A≥23eϵpk/2.2π−−−−−−√
L'hypothèse, , implique , qui avec (iii) donne (iv) .ϵ2pk≥3 ϵpk−−√≥3–√ A≥23e3/2.2π−−−−−−√≥0.1
De il s'ensuit que (v) .ϵ2pk≥3 exp(−ϵ2pk)≤exp(−3)≤0.04
(iv) et (v) donnent ensemble la demande. QED
Revendication 3. .B≥exp(−8ϵ2pk)
Preuve de revendication 3. Fixez telle sorte que . Le choix de implique , donc la revendication restera aussi longtemps que . En prenant chaque côté de cette dernière inégalité à la puissance et en simplifiant, cela équivaut à Substituant et simplifiant, il équivaut àδ ℓ=(1−δ)pk
ℓ δ≤2ϵ B≥exp(−2δ2pk) −1/ℓ
Les revendications 2 et 3 impliquent . Cela implique une partie (i) du lemme.AB≥exp(−ϵ2pk)exp(−8ϵ2pk)
Preuve du lemme 1 partie (ii). Sans perte de généralité, supposons que chaque variable aléatoire est avec une probabilité exactement .1 p
Remarque . Fixez .Pr[X≥(1+ϵ)p]=∑ni=⌈(1−ϵ)pk⌉Pr[X=i/k] ℓ^=⌈(1+2ϵ)pk⌉−1
Les derniers termes dans la somme totale au moins , qui est au moins . (La preuve en est la même que pour (i), sauf avec remplacé par et remplacé par telle sorte que .) QEDϵpk (ϵpk−2)Pr[X=ℓ^/k] exp(−9ϵ2pk) ℓ ℓ^ δ −δ^ ℓ^=(1+δ^)pk
la source
Le théorème de Berry-Esseen peut donner des limites inférieures de probabilité de queue, tant qu'elles sont supérieures à .n−1/2
Un autre outil que vous pouvez utiliser est l' inégalité de Paley-Zygmund . Cela implique que pour tout entier pair et toute variable aléatoire de valeur réelle ,k X
Avec le théorème multinomial, pour une somme de variables aléatoires rademacher Paley-Zygmund peut vous donner des bornes inférieures assez fortes. Il fonctionne également avec des variables aléatoires d'indépendance bornée. Par exemple , vous obtenez facilement que la somme indépendante 4-sage variables aléatoires est avec une probabilité constante.X n n ±1 Ω(n−−√)
la source
Si vous êtes en effet d'accord avec les sommes limites des essais de Bernoulli (et non, disons, les variables aléatoires bornées), ce qui suit est assez serré.
(Traiter l'argument de comme transformant la normale standard, cela correspond exactement à ce que le CLT vous dit; en fait, cela nous dit que les binômes satisfaisant aux conditions du théorème domineront leurs gaussiens correspondants sur les queues supérieures.)Φ
À partir d'ici, vous pouvez utiliser des limites sur pour obtenir quelque chose de plus agréable. Par exemple, dans le premier livre de Feller, dans la section sur les Gaussiens, il est indiqué pour chaque que où est la densité d'une normale standard. Il existe également des limites similaires dans l'article de Wikipédia pour la "fonction Q".Φ z>0
À part cela, et ce que d'autres personnes ont dit, vous pouvez également essayer d'utiliser le Binomial directement, peut-être avec du Stirling.
(*) Certaines déclarations plus récentes de l'inégalité de Slud omettent certaines de ces conditions; J'ai reproduit celui dans le papier de Slud.
la source
Le théorème de Moivre-Laplace montre que des variables comme, après avoir été convenablement normalisé et sous certaines conditions, convergera en distribution vers une distribution normale. C'est suffisant si vous voulez des bornes inférieures constantes.|T∩S1|
Pour les bornes inférieures comme , vous avez besoin d'un outil légèrement plus fin. Voici une référence que je connais (mais seulement par accident - je n'ai jamais eu l'occasion d'utiliser moi-même une telle inégalité). Certaines limites inférieures explicites sur les probabilités de queue des distributions binomiales sont données comme Théorème 1.5, le livre Graphiques aléatoires de Béla Bollobás, Cambridge, 2e édition, où d'autres références sont données à Une introduction à la probabilité et ses applications par Feller et Foundations of Probability par Rényi.n−c
la source
Le théorème de Littlewood-Offord généralisé n'est pas exactement ce que vous voulez, mais il donne ce que je pense être un "Tchernoff inversé" lié en montrant que la somme des variables aléatoires est peu susceptible de se situer dans une petite plage autour d'une valeur particulière (y compris l'attente). Ce sera peut-être utile.
Formellement, le théorème est le suivant.
Théorème généralisé de Littlewood-Offord : Soit et des nombres réels tels que pour et soit des variables aléatoires indépendantes qui ont des valeurs zéro et un. Pour , supposons que pour tout . Ensuite, pour tout , Où est une constante ne dépendant que de .a1,…,an s>0 |ai|≥s 1≤i≤n X1,…,Xn 0<p≤12 p≤Pr[Xi=0]≤1−p 1≤i≤n r∈R
la source
L'exposant dans la borne Chernoff standard, comme il est indiqué sur Wikipédia, est serré pour les variables aléatoires de valeur 0/1. Soit et soit une séquence de variables aléatoires indépendantes telles que pour chaque , et . Alors pour chaque ,0<p<1 X1,X2,… i Pr[Xi=1]=p Pr[Xi=0]=1−p ε>0
Ici, , qui est la divergence de Kullback-Leibler entre Bernoulli aléatoire variables avec les paramètres et .D(x∥y)=xlog2(x/y)+(1−x)log2((1−x)/(1−y)) x y
Comme mentionné, la limite supérieure de l'inégalité ci-dessus est prouvée sur Wikipedia ( https://en.wikipedia.org/wiki/Chernoff_bound ) sous le nom de "Théorème de Chernoff-Hoeffding, forme additive". La borne inférieure peut être prouvée en utilisant par exemple la "méthode des types". Voir Lemme II.2 dans [1]. En outre, cela est couvert dans le manuel classique sur la théorie de l'information par Cover et Thomas.
[1] Imre Csiszár: La méthode des types. Transactions de l'IEEE sur la théorie de l'information (1998). http://dx.doi.org/10.1109/18.720546
la source