Considérez le processus suivant:
Il y a bacs disposés de haut en bas. Initialement, chaque bac contient une balle. À chaque étape, nous
- choisir une balle uniformément au hasard et
- déplacez toutes les boules du bac contenant vers le bac en dessous. S'il s'agissait déjà du bac le plus bas, nous retirons les billes du processus.
Combien d'étapes faut-il attendre jusqu'à la fin du processus, c'est-à-dire jusqu'à ce que toutes les boules aient été retirées du processus? Cela a-t-il été étudié auparavant? La réponse découle-t-elle facilement des techniques connues?
Dans le meilleur des cas, le processus peut se terminer après étapes. Dans le pire des cas, il peut prendre pas. Les deux cas devraient cependant être très improbables. Ma conjecture est que cela prend étapes et j'ai fait quelques expériences qui semblent le confirmer.
(Notez que choisir un bac uniformément au hasard est un processus très différent qui prendra évidemment étapes pour terminer.)
Réponses:
Pas vraiment une réponse, mais un long commentaire sur la réponse d'András.
La réponse d'András contient une belle intuition, bien que je ne pense pas que ce soit un calcul rigoureux du nombre prévu d'étapes. Je pense que c'est peut-être une bonne approximation d'une réponse, mais cela ne semble pas traiter correctement les cas où le bac en dessous du bac occupé le plus haut devient vide avant que le bac supérieur soit vidé vers le bas. Pourtant, cela pourrait être une approximation raisonnable à faire (je ne suis pas sûr).
Son calcul contient une erreur qui affecte la mise à l'échelle. Je vais prendre exactement le même point de départ, refaire et étendre le calcul.
Il manque un facteur de p à l'intérieur de la somme, car la probabilité de choisir au hasard le bon bac est plutôt que1pn . En conséquence, nous avons1n
où est le nième nombre harmonique . Pour approximer H n, nous pouvons simplement remplacer la somme par une intégrale: H n ≈ ∫ n + 1 1 1Hn=∑np=11/p Hn . Ainsi, la mise à l'échelle estn(1+log(n+1))ou environnlog(n+1). Bien que cette mise à l'échelle ne corresponde pas exactement à la mise à l'échelle du problème (voir simulation ci-dessous), elle est presque exactement un facteur delog(2).Hn≈∫n+111xdx=log(n+1) n(1+log(n+1)) nlog(n+1) log(2)
Cercles rouges: points de données de la simulation du processus en moyenne sur 10 000 exécutions. Vert: . Bleu: n log ( n + 1 ) .nlog2(n+1) nlog(n+1)
la source
Edit: Je laisse cette réponse telle quelle (pour l'instant) pour illustrer le processus désordonné de prouver les théorèmes, quelque chose qui est omis des articles publiés. L'intuition principale ici est qu'il suffit de se concentrer sur la balle supérieure, car elle balaie tout en dessous. Veuillez consulter les commentaires (en particulier @Michael soulignant que des lacunes peuvent se produire) et la réponse ultérieure de @ Joe pour savoir comment les erreurs ont été identifiées et corrigées. J'aime particulièrement l'utilisation des expériences de Joe pour vérifier que les formules étaient raisonnables.
la source