inférieure pour estimer pour non-croissant

Je voudrais savoir (en relation avec cette autre question ) si des limites inférieures étaient connues pour le problème de test suivant: on a accès à une requête à une séquence de nombres non négatifs et , avec la promesse que ou . $a_n \geq \dots\geq a_1$ $\varepsilon \in (0,1)$ $\sum_{k=1}^n a_k = 1$ $\sum_{k=1}^n a_k \leq 1-\varepsilon$

Combien de requêtes (recherches) sont suffisantes et nécessaires pour qu'un algorithme randomisé (adaptatif) fasse la distinction entre les deux cas, avec une probabilité d'au moins ? $2/3$

J'ai trouvé un article précédent qui donne une borne supérieure logarithmique (en ) pour le problème connexe d'approximation de la somme, et une borne inférieure correspondant approximativement à ce problème pour les algorithmes déterministes; mais je n'ai pas pu trouver de résultat pour le problème spécifique que je considère (en particulier, les algorithmes randomisés). $n$

Edit: Après la réponse ci-dessous, je suppose que j'aurais dû être plus clair: dans ce qui précède (et en particulier dans les asymptotiques pour la borne inférieure), est la quantité "principale" vue comme allant à l'infini, tandis que est un (arbitrairement petite) constante. $n$ $\varepsilon$

reference-request randomized-algorithms property-testing Clement C.
la source

Je suppose que vous voulez dire .

\sum_{k = 1}^{n} a_{k} \leq 1 - ε

$\sum_{k=1}^n a_k \leq 1-\varepsilon$

En effet - corrigé.

Clement C.

Eh bien, sans l'ordre, une dépendance à serait nécessaire, je pense (avec ou sans échantillonnage). Une "mauvaise" instance (paire de séquences) serait par exemple une séquence avec tous les égaux à , à l'exception d'une seule (arbitraire, aléatoire) telle que est égal à (dans la première séquence) et à (dans la seconde). Sans requêtes , les deux séquences ne peuvent pas être distinguées ...

n

$n$

a_{k}

$a_k$

\frac{1 - ε}{n - 1}

$\frac{1-\varepsilon}{n-1}$

j

$j$

a_{j}

$a_j$

ε

$\varepsilon$

0

$0$

Ω (n)

$\Omega(n)$

Clement C.

Je suppose que le modèle de requête vous permet de choisir le pour lequel vous interrogez , est-ce vrai?

k

$k$

a_{k}

$a_k$

kodlu

Oui (vous pouvez choisir le point que vous souhaitez "divulguer").

Clement C.

Réponses:

Voici les limites inférieures que je peux montrer. Je suppose que pour un fixe , la borne inférieure droite est , mais naturellement je peux me tromper. $\epsilon$ $\Omega( \log n)$

Je vais utiliser une séquence décroissante (juste pour plus de commodité). Le mécanisme de base consiste à diviser la séquence en blocs. Dans le ème bloc, il y aura éléments (c'est-à-dire, ). $L$ $i$ $n_i$ $\sum_i n_i = n$

Dans ce qui suit, nous voulons que l'algorithme réussisse avec la probabilité , pour certains paramètres . $\geq 1-\delta$ $\delta >0$

Première borne inférieure: . $\displaystyle \Omega\left( \frac{1}{\epsilon} \log \frac{1}{\delta} \right)$

Le ème bloc a éléments, donc . Nous fixons la valeur de tous les éléments du ème bloc à , où est une variable qui est soit soit . Clairement, la somme totale de cette séquence est $i$ $n_i = 2^{i-1}$ $L = \lg n$ $i$ $(1+X_i)/(2n_iL)$ $X_i$ $0$ $1$ Imaginez que vous choisissiez chaqueavec une probabilitéàetsinon. Pour estimer, nous avons besoin d'une estimation fiable de. En particulier, nous voulons pouvoir distinguer la baseet, disons,.

α = \sum_{i = 1}^{L} \frac{1 + X_{i}}{2 n_{i} L} = \frac{1}{2} + \frac{1}{2 L} (\sum_{i = 1}^{L} X_{i}) .

$\alpha = \sum_{i=1}^L \frac{1+X_i}{2n_i L} = \frac{1}{2} + \frac{1}{2L}\left(\sum_{i=1}^L X_i \right).$

X_{i}

$X_i$

β

$\beta$

1

$1$

0

$0$

α

$\alpha$

β

$\beta$

β = 1 - 4 ϵ

$\beta = 1-4\epsilon$

β = 1

$\beta=1$

Imaginons maintenant que l'on échantillonne de ces variables aléatoires et que soient les variables échantillonnées. Paramètres (notez que nous prenons la somme des variables du complément ), nous avons , et l'inégalité de Chernoff nous dit que si $m$ $Z_1, \ldots, Z_m$ $Y = \sum_{i=1}^m (1-X_i)$ $\mu = E[Y] = (1-\beta) m$ , alors , et la probabilité de défaillance est Pour rendre cette quantité inférieure à $\beta =1-4\epsilon$ $\mu = 4\epsilon m$

P [Y \leq 2 ϵ m] = P [Y \leq (1 - 1 / 2) μ] \leq \exp (- μ (1 / 2)^{2} / 2) = \exp (- ϵ m / 2) .

$P\left[ Y \leq 2\epsilon m \right] = P\left[ Y \leq (1-1/2) \mu \right] \leq \exp \left( -\mu (1/2)^2 / 2 \right) = \exp \left( -\epsilon m / 2 \right).$

, nous avons besoin de

δ

$\delta$

m \geq \frac{2}{ϵ} \ln \frac{1}{δ}

$\displaystyle m \geq \frac{2}{\epsilon} \ln \frac{1}{\delta}$

L'observation clé est que l'inégalité de Chernoff est étroite (il faut faire attention, car elle n'est pas correcte pour tous les paramètres, mais elle est correcte dans ce cas), donc vous ne pouvez pas faire mieux que cela (jusqu'aux constantes).

Deuxième borne inférieure: . $\Omega( \log n / \log \log n)$

Définissez la taille du ème bloc sur , où est le nombre de blocs. Un élément du ème bloc a la valeur . La somme totale des valeurs de la séquence est donc . $i$ $n_i = L^i$ $L = \Theta( \log n / \log \log n)$ $i$ $\alpha_i = \Bigl(1/L\Bigr)/n_i$ $1$

Maintenant, nous pourrions décider de choisir un bloc arbitraire, disons le ème, et définir toutes les valeurs de son bloc pour être (au lieu de ). Cela augmente la contribution du ème bloc de à , et augmente la masse totale de la séquence à (presque) . $j$ $\alpha_{j-1} = L \alpha_j$ $\alpha_j$ $j$ $1/L$ $1$ $2$

Désormais, de manière informelle, tout algorithme randomisé doit vérifier la valeur dans chacun des blocs. En tant que tel, il doit lire au moins valeurs de la séquence. $L$

Pour l'argument ci - dessus plus formel, avec une probabilité , donner la séquence originale de masse comme entrée (on se réfère à ce que l' entrée d' origine). Sinon, sélectionnez au hasard le bloc qui a les valeurs augmentées (entrée modifiée). De toute évidence, si l'algorithme aléatoire lit inférieur, par exemple, entrées, elle a une probabilité (ou moins) pour détecter une entrée modifiée. En tant que tel, la probabilité que cet algorithme échoue, s'il lit moins de entrées, est d'au moins $p=1/2$ $1$ $L/8$ $1/8$ $L/8$

(1 - p) (7 / 8) > 7 / 16 > 1 / 3.

$(1-p)(7/8) > 7/16 > 1/3.$

PS Je pense qu'en faisant plus attention aux paramètres, la première borne inférieure peut être améliorée à . $\Omega(1/\epsilon^2)$

Sariel Har-Peled
la source

Merci pour ça! J'ai une petite question concernant le premier,

lb (plus particulièrement l'amélioration quadratique possible). Puisque nous avons ici le problème de la promesse unilatérale, ce qui implique que dès que l'algorithme "voit" une valeur qui donne la moindre preuve que

, il peut conclure sans avoir à obtenir une estimation plus précise de

: ne cela veut dire que le

est optimal pour cette construction, essentiellement on pouvait s'y attendre , soit tous les

l » être 1 ou au moins une

fraction ne pas être?

Ω (1 / ϵ)

$\Omega(1/\epsilon)$

β < 1

$\beta < 1$

β

$\beta$

1 / ϵ

$1/\epsilon$

X_{i}

$X_i$

ϵ

$\epsilon$

Clement C.

Ouais. Si vous souhaitez uniquement distinguer entre 1 et 1-epsilon, vous ne pouvez bien sûr pas améliorer la borne inférieure ... Je pensais essayer de distinguer d'autres gammes ... s

Sariel Har-Peled

Borne inférieure

Au moins requêtes sont nécessaires pour distinguer les deux cas. $\Omega(1/\sqrt{\epsilon})$

$a_1,\dots,a_n$ $\epsilon,2\epsilon,3\epsilon,4\epsilon,\dots$ $n$ $a_1+\dots+a_n = 1$ $n \approx 1/\sqrt{2\epsilon}$

$a'_1,\dots,a'_n$ $\epsilon$ $a'_1=a_1$ $a'_2=a_2$ $a'_i = a_i - \epsilon$ $a'_1 + \dots + a'_n = 1-\epsilon$

$a_1,\dots,a_n$ $a'_1,\dots,a'_n$ $i$ $\Omega(n)$ $n \approx 1/\sqrt{2\epsilon}$ $\Omega(1/\sqrt{\epsilon})$

Limite supérieure

$O(\lg(n/\epsilon) [\lg n + 1 / \epsilon^2])$

$[0,1]$

[0, 1] = [0, 0.25 ϵ / n] \cup (0.25 ϵ / n, 0.5 ϵ / n] \cup (0.5 ϵ / n, ϵ / n] \cup (ϵ / n, 2 ϵ / n] \cup (2 ϵ / n, 4 ϵ / n] \cup \dots \cup (\dots, 1] .

$[0,1] = [0,0.25\epsilon/n] \cup (0.25\epsilon/n,0.5\epsilon/n] \cup (0.5\epsilon/n,\epsilon/n] \cup (\epsilon/n,2\epsilon/n] \cup (2\epsilon/n,4\epsilon/n] \cup \dots \cup (\ldots,1].$

$a_i$ $a_i$ $a_i$ $[\ell,u]$ $i,j$ $a_i,\dots,a_j \in [\ell,u]$ $O(\lg(n/\epsilon))$

Maintenant, nous allons estimer la somme des valeurs dans chaque plage. La première gamme sera traitée séparément de toutes les autres:

$[0,0.25\epsilon/n)$ $0$ $m \times 0.25\epsilon/n$ $m$ $m \le n$ $0.25 \epsilon$
$\delta$ $O(1/\delta^2)$ $2 \times$ $\delta = 0.25 \epsilon$

$0.25 \epsilon$ $0.25 \epsilon$ $\le 0.5 \epsilon$ $1$ $1-\epsilon$

DW
la source

Merci - cela semble intéressant (pour autant que je sache, ce n'est pas la même approche que celle utilisée dans le document / discussion lié ci-dessus), et j'examinerai de plus près ce que vous avez écrit. Cependant, je recherche une borne inférieure plutôt qu'une borne supérieure - c'est-à-dire combien de requêtes sont nécessaires .

Clement C.

(Comme le temps est écoulé, j'attribue néanmoins la "prime" à la réponse - bien que je recherche toujours une référence pour une borne inférieure, s'il y en a quelque part là-haut.)

Clement C.

@ClementC., J'ai ajouté une limite inférieure, selon votre demande.

n

$n$

ε

$\varepsilon$