Limites des moments de fréquence approximatifs

11

Soit une séquence d'entiers où chacun . Pour , soit. Le ème moment de fréquence est défini comme étanta j{ 1 , 2 , , n } i { 1 , 2 , , n } m i = | { j : a j = i } | kune1,une2,,unemunej{1,2,,n}je{1,2,,n}mje=|{j:unej=je}|k

Fk=je=1nmjek.

Dans leur article bien connu, La complexité spatiale de l'approximation des moments de fréquence , Alon et al. donner un algorithme de streaming qui se rapproche de utilisant approximativement l' . Ils utilisent également des techniques de complexité de communication pour obtenir une limite inférieure de pour . Pour , ils fournissent des bornes supérieure et inférieure plus ou moins concordantes. O ( n 1 - 1FkO(n1-1k(Journaln+Journalm))Ω(n1-5k)k>5k=0,1,2

Y a-t-il eu des améliorations à ces bornes depuis lors, et y a-t-il eu des progrès pour ?k=3,4,5

Timothy Sun
la source

Réponses:

14

Il y a eu pas mal de progrès. Sur le problème spécifique de , il existe une limite supérieure et inférieure correspondante de n 1 - 2 / k pour k > 2 . Les limites supérieures proviennent de cet article d'Indyk et Woodruff (paru dans STOC 2005) et les limites inférieures sont via le cadre de complexité de l'information, en raison de Bar-Yossef et al et Chakrabarti et al .Fkn1-2/kk>2

Suresh Venkat
la source
3
Ceci est également pertinent: arxiv.org/abs/1011.1263
Mahdi Cheraghchi
1
Vérifiez le lien @MCH envoyé, cela rend l'algorithme et l'analyse maigre et méchant. Mais peut-être que la thèse de David sera également utile pour l'intuition et la discussion: almaden.ibm.com/cs/people/dpwoodru/phdFinal.pdf
Sasho Nikolov
3

Pour k <= 2

1) k = 0, la limite est de http://people.seas.harvard.edu/~minilek/papers/f0.pdf .O(1/ϵ2+log(n))

2) k = 1, l'article d'Alon et all fait référence à l'article de Morris qui prend un espace de .O~(log(log(n))

3) k = 2, je pense que le croquis AMS de leur papier est optimal

Ashwinkumar BV
la source
1

Quelque chose de lié.

Fααϵn

Ashwinkumar BV
la source
1
α(1,2)nϵ