Distance statistique entre pièce uniforme et pièce biaisée

9

Soit U ait la distribution uniforme sur n bits et soit D soit la répartition sur n bits avec les bits sont indépendants et chaque bit est 1 avec une probabilité de 1/2ϵ . Est-il vrai que la distance statistique entre D et U est Ω(ϵn), lorsquen1/ϵ2?

Manu
la source
2
Oui. La distance statistique entre U et V est au moins PrU(Xje>n/2)-Pr(Xje>n/2) , qui est Ω(εn); voir par exemple la réponse de matus ici:cstheory.stackexchange.com/questions/14471/…
Yury
2
Merci. Peut-être expliquer comment obtenir cela de ce que Matus a écrit dans une réponse que je peux accepter?
Manu
1
En ce qui concerne la réponse de Matus, vous pouvez faire mieux que l'inégalité de Slud; voir (2.13,2.14) dans arxiv.org/abs/1606.08920
Aryeh

Réponses:

7

x1,,xnUD t t = n / 2 + PrU(xit)PrD(xit)tt=n/2+n

Notez que pour une constante absolue . Si , alors la distance statistique est au moins , et nous avons terminé. Nous supposons donc ci-dessous que .c 1 > 0 Pr D ( Σ x it )c 1 / deux c 1 / deux Pr D ( Σ x it )c 1 / deuxPrU(xit)c1c1>0PrD(xit)c1/2c1/2PrD(xit)c1/2

Soit pour les variables aléatoires iid Bernoulli avec . Notre objectif est de prouver que . Par le théorème de la valeur moyenne, pour certains . Maintenant, nous allons prouver que ; cela impliquera que la distance statistique souhaitée est au moins , comme requis. x 1 , ... , x n Pr ( x i = 1 ) = 1 / deux - s f ( 0 ) - f ( ε ) = Ω ( ε f(s)=Pr(xit)x1,,xnPr(xi=1)=1/2sf(0)-f(ε)=-εf(ξ),ξ(0,ε)-f(ξ)Ω(f(0)f(ε)=Ω(εn)

f(0)f(ε)=εf(ξ),
ξ(0,ε)Ω(f(ξ)Ω(n)Ω(nε)

Écriture, et Notez que Donc, f(ξ)

f(ξ)=kt(nk)(12-ξ)k(12+ξ)n-k,
k/2+kξ-(n-k)/2+(n-k)ξ
f(ξ)=kt(nk)(k(12ξ)k1(12+ξ)nk+(nk)(12ξ)k(12+ξ)nk1)=kt(nk)(12ξ)k(12+ξ)nkk/2+kξ(nk)/2+(nk)ξ(1/2ξ)(1/2+ξ).
- f ( ξ )
k/2+kξ(nk)/2+(nk)ξ(1/2ξ)(1/2+ξ)=(2kn)/2+nξ(1/2ξ)(1/2+ξ)2(2tn)=4n.
f(ξ)4nkt(nk)(12ξ)k(12+ξ)nk=4nf(ξ)4nf(ε)4n(c1/2).
Ici, nous avons utilisé l'hypothèse que . Nous avons montré que .f(ε)=PrD(x1++xnt)c1/2f(ξ)=Ω(n)
Yury
la source
5

Une preuve un peu plus élémentaire et un peu plus désordonnée (ou du moins ça me semble).

Pour plus de commodité, écrivez , avec par hypothèse.ε=γnγ[0,1)

Nous limitons explicitement l'expression de : TV(P,U)

2TV(P,U)=X{0,1}n|(12+γn)|X|(12-γn)n-|X|-12n|=12nk=0n(nk)|(1+2γn)k(1-2γn)n-k-1|12nk=n2+nn2+2n(nk)|(1+2γn)k(1-2γn)n-k-1|Cnk=n2+nn2+2n|(1+2γn)k(1-2γn)n-k-1|
où est une constante absolue. Nous réduisons chaque borne séparément: en fixant , et en écrivant , sorte que chaque sommet soit limité par une quantité qui converge (quand ) àC>0k=k-n2[n,2n]
(1+2γn)k(1-2γn)n-k=(1-4γ2n)n/2(1+2γn1-2γn)(1-4γ2n)n/2(1+2γn1-2γn)nne4γ-2γ2
ne4γ-2γ2-1>4γ-2γ2>2γ ; ce qui implique que chacun est . En résumé, cela donne comme revendiqué.Ω(γ)
2TV(P,U)Cnk=n2+nn2+2nΩ(γ)=Ω(γ)=Ω(εn)
Clement C.
la source
(Utiliser Hellinger comme proxy en raison de ses belles propriétés par rapport aux distributions de produits est tentant et serait beaucoup plus rapide, mais il y aurait une perte par un facteur quadratique à la limite inférieure.)
Clement C.
1
Agréable! J'aime l'approche élémentaire. Nous devrions également pouvoir le rendre non asymptotique en .... une façon consiste à utiliser , puis utilisez la belle inégalité . Un peu plus compliqué. n(1+z1-z)n(1+2z)n1+wew-w2/2
usul