Forte concentration pour la sélection via un partitionnement aléatoire?

11

L'algorithme simple habituel pour trouver l'élément médian dans un tableau de n nombres est:An

  • Echantillon des éléments de A , avec remplacement en Bn3/4AB
  • Triez et trouvez le rang | B | ± B élémentsletrdeB|B|±nlrB
  • Vérifier que et r sont de part et d'autre de la médiane de A et qu'il y a au plus C lrA éléments dansAentreletrpour une constante appropriéeC>0. Échouez si cela ne se produit pas.CnAlrC>0
  • Sinon, trouvez la médiane en triant les éléments de entre l et rAlr

Il n'est pas difficile de voir que cela fonctionne en temps linéaire et qu'il réussit avec une forte probabilité. (Tous les mauvais événements sont des écarts importants par rapport à l'attente d'un binôme.)

Un algorithme alternatif pour le même problème, qui est plus naturel à enseigner aux élèves qui ont vu un tri rapide, est celui décrit ici: Sélection aléatoire

Il est également facile de voir que celui-ci a un temps d'exécution prévu linéaire: disons qu'un "round" est une séquence d'appels récursifs qui se termine lorsque l'on donne un fractionnement 1 / 4-3 / 4, puis observez que la longueur attendue de un tour est au maximum de 2. (Dans le premier tirage d'un tour, la probabilité d'obtenir un bon fractionnement est de 1/2, puis augmente en fait, comme l'algorithme a été décrit de sorte que la longueur du tour est dominée par une variable aléatoire géométrique.)

Alors maintenant, la question:

Est-il possible de montrer que la sélection aléatoire s'exécute en temps linéaire avec une forte probabilité?

O(logn)k2k+1O(nloglogn)11/O(logn)

C'est un peu insatisfaisant, mais est-ce vraiment la vérité?

Louis
la source
Veuillez préciser à quel algorithme vos questions se réfèrent.
Raphael
Demandez-vous si vous avez appliqué correctement votre limite d'union ou s'il existe une limite meilleure et plus satisfaisante?
Joe
@Joe Ce dernier. Le fait est que les rondes sont un artefact pour obtenir que la longueur des rondes soit dominée par une géométrie. Ensuite, l'anaylisys "oublie" si l'algorithme est en avant ou en arrière de celui qui obtient toujours une division 1 / 4-3 / 4 sur le nez pour rendre la géométrie indépendante. Je demande si cette "tricherie" comme Yuval l'a dit ci-dessous est toujours aussi serrée.
Louis

Réponses:

5

Θ(n)G(1/2)p(n)0Pr[G(1/2)log2p(n)1]=p(n)Ω(nlog2p(n)1)=ω(n)

G(1/2)

n

Yuval Filmus
la source
C>0C>0
1
CCnpC>0
Je suis plus heureux maintenant, car la longueur ronde n'est pas beaucoup plus petite que la géométrie utilisée pour la limite supérieure. J'imagine que c'est ce que G&R rend nerveux. Bonne réponse.
Louis