J'ai pensé à ce problème il y a longtemps, mais je n'ai aucune idée à ce sujet.
L'algorithme de génération est le suivant. Nous supposons qu'il y a nœuds discrets numérotés de à . Ensuite, pour chaque dans , nous faisons du parent du ème nœud dans l'arbre un nœud aléatoire dans . Itérer à travers chaque afin que le résultat soit un arbre aléatoire avec le noeud racine . (Ce n'est peut-être pas assez aléatoire, mais cela n'a pas d'importance.)
Quelle est la profondeur attendue de cet arbre?
pr.probability
zhxchen17
la source
la source
Réponses:
Je pense qu'il y a un résultat de concentration surelogn , mais je n'ai pas encore rempli les détails.
Nous pouvons obtenir une limite supérieure pour la probabilité que le nœud ait d ancêtres non compris 0 . Pour chaque chaîne complète possible de d ancêtres non nuls ( a 1 , a 2 , . . . , A d ) , la probabilité de cette chaîne est ( 1n d 0 d (a1,a2,...,ad) . Cela correspond à1(1a1)(1a2)⋯(1ad)×1n fois un terme de(1+11n où les conditions sont ordonnées. Ainsi, une limite supérieure pour cette probabilité est1(1+12+13+⋯1n−1)d oùHn-1est len-1er numéro harmonique1+11n(d!)Hdn−1 Hn−1 n−1 . Hn-1≈log(n-1)+γ. Pourdetn→∞fixes, la probabilité que le nœudnsoit à la profondeurd+1est au plus1+12+...+1n−1 Hn−1≈log(n−1)+γ d n→∞ n d+1
Par approximation de Stirling, nous pouvons estimer cela comme
Pour grand , tout ce qui est beaucoup plus grand que e log n , la base de l'exponentielle est petite, donc cette borne est petite, et nous pouvons utiliser l'union liée pour dire que la probabilité qu'il y ait au moins un nœud avec d ancêtres non nuls est petit.d elogn d
Voir
Luc Devroye, Omar Fawzi, Nicolas Fraiman. "Propriétés de profondeur des arbres récursifs aléatoires d'attachement à l'échelle."
B. Pittel. Remarque sur les hauteurs d'arbres récursifs aléatoires et d'arbres de recherche m-aire aléatoires. Random Structures and Algorithms, 5: 337–348, 1994.
Le premier affirme que le second a montré que la profondeur maximale est avec une probabilité élevée, et offre une autre preuve.(e+o(1))logn
la source
Cette question a reçu une réponse il y a plusieurs années, mais, juste pour le plaisir, voici une simple preuve de la limite supérieure. Nous donnons une borne sur l'attente, puis une queue liée.
Définissez rv la profondeur du nœud i ∈ { 0 , 1 , … , n - 1 } . Définissez ϕ i = ∑ i j = 0 e d j .di i∈{0,1,…,n−1} ϕi=∑ij=0edj.
lemme 1. La profondeur maximale attendue, est au plus eE[maxidi] .eHn−1
Preuve. La profondeur maximale est au plus . Pour finir nous montrons E [ ln ϕlnϕn−1 .E[lnϕn−1]≤eHn−1
Pour tout , conditionner sur ϕ i - 1 , par inspection de ϕ i , E [ ϕ ii≥1 ϕi−1 ϕi
Par récurrence, il s'ensuit que
So, by the concavity of the logarithm,
Here is the tail bound:
lemma 2. Fix anyc≥0 . Then Pr[maxidi]≥eHn−1+c is at most exp(−c) .
Proof. By inspection ofϕ , and the Markov bound, the probability in question is at most
As for a lower bound, I think a lower bound of(e−1)Hn−O(1) follows pretty easily by considering maxidi≥lnϕt−lnn . But...[EDIT: spoke too soon]It doesn't seem so easy to show the tight lower bound, of(1−o(1))eHn ...
la source
I have actually thought about the same question (although in a completely different formulation) a few months ago, as well as some close variants.
I don't have a closed form (/ asymptotic) solution for it, but you might find this view useful (are you only looking for upper bound perhaps?).
The process you describe here is a generalization of the Chinese Restaurant Process, where each "table" is a subtree whose root's parent isv0 .
This also gives us a recursion formula for your question.
Denote byh(n) the expected heights of a such tree process with n nodes.
Denote byPn(B)=Πb∈B(b−1)!n! (the probability of distribution B of the nodes into subtrees).
Then the quantity you're looking for,h(n) , is given by:
If you wish to code this recursion, make sure you use the following so it won't go into infinite loop:
WhereBn is the set of all partitions of n identical balls into any number of non-empty bins, and h(1)=1 .
In practice, when I needed this I just used a simple monte-carlo method for estimatingh(n) , as trying to actually compute h by this method is extremely inefficient.
la source