Tracer n intervalles uniformément de façon aléatoire, probabilité qu'au moins un intervalle se chevauche avec tous les autres

17

Dessinez au hasard intervalles de , où chaque point final A, B est sélectionné dans la distribution uniforme entre .n [ 0 , 1 ] [ 0 , 1 ]n[0,1][0,1]

Quelle est la probabilité qu'au moins un intervalle se chevauche avec tous les autres?

Vengeance
la source
Vous pouvez examiner la probabilité que le dernier dessiné soit plus petit que le minimum de tous les précédemment dessinés , et la probabilité que le dernier soit supérieur au maximum de tous les précédemment dessinés . Cela devrait être utile. Gonflez ensuite la probabilité pour tenir compte du fait que nous n'avons pas besoin du dernier , mais de tout le monde. (Je n'ai pas le temps de travailler dessus, mais cela ressemble à un petit problème amusant. Bonne chance!)A n A B n BAnABnB
S. Kolassa - Réinstalle Monica
Il peut être quelque peu surprenant que (1) la réponse ne dépende pas de la distribution (seulement qu'elle soit continue) et (2) pour elle est constante! n > 1n>1
whuber
1
Est-ce ainsi que le n ème intervalle est interprété: i) tirer uniformément deux nombres au hasard à partir de [0,1], ii) laisser le plus petit être A nAn et le plus grand B nBn ?
ekvall

Réponses:

5

Ce message répond à la question et décrit les progrès partiels vers la preuve de son exactitude.


Pour , la réponse est trivialement . Pour tout plus grand , il est (étonnamment) toujours .n = 1 1 n 2 / 3n=11n2/3

Pour voir pourquoi, observons d'abord que la question peut être généralisée à toute distribution continue (à la place de la distribution uniforme). Le processus par lequel les intervalles sont générés revient à dessiner iid fait varier de et forme les intervallesF n 2 n X 1 , X 2 , , X 2 n FFn2nX1,X2,,X2nF

[ min ( X 1 , X 2 ) , max ( X 1 , X 2 ) ] , , [ min ( X 2 n - 1 , X 2 n ) , max ( X 2 n - 1 , X 2 n ) ] .

[min(X1,X2),max(X1,X2)],,[min(X2n1,X2n),max(X2n1,X2n)].

Parce que tous les des sont indépendants, ils sont échangeables. Cela signifie que la solution serait la même si nous devions les permuter au hasard. Conditionnons donc les statistiques d'ordre obtenues en triant les :2 n X i X i2nXiXi

X ( 1 ) < X ( 2 ) < < X ( 2 n )

X(1)<X(2)<<X(2n)

(où, parce que est continu, il n'y a aucune chance que deux soient égaux). Les intervalles sont formés en sélectionnant une permutation aléatoire et en les connectant par pairesF n σ S 2 nFnσS2n

[ min ( X σ ( 1 ) , X σ ( 2 ) ) , max ( X σ ( 1 ) , X σ ( 2 ) ) ] , , [ min ( X σ ( 2 n - 1 ) , X σ ( 2 n ) ) , max ( X σ ( 2n - 1 ) , X σ ( 2 n ) )].

[min(Xσ(1),Xσ(2)),max(Xσ(1),Xσ(2))],,[min(Xσ(2n1),Xσ(2n)),max(Xσ(2n1),Xσ(2n))].

Que deux d'entre eux se chevauchent ou non ne dépend pas des valeurs de ,X ( i )X(i) car le chevauchement est préservé par toute transformation monotone et il y en a transformations qui envoient à . Ainsi, sans perte de généralité, on peut prendre et la question devient:f : RR X ( i ) i X ( i ) = if:RRX(i)iX(i)=i

Que l'ensemble soit partitionné en doubletons disjoints. Deux d'entre eux, et (avec ), se chevauchent lorsque et . Disons qu'une partition est "bonne" quand au moins un de ses éléments chevauche tous les autres (et sinon est "mauvaise"). En fonction de , quelle est la proportion de bonnes partitions?{ 1 , 2 , , 2 n - 1 , 2 n } n { l 1 , r 1 } { l 2 , r 2 } l i < r i{1,2,,2n1,2n}n{l1,r1}{l2,r2}li<rir 1 > l 2 r 2 > l 1 nr1>l2r2>l1n

Pour illustrer, considérons le cas . Il y a trois partitions,n = 2n=2

{{1,2},{3,4}}, {{1,4},{2,3}}, {{1,3},{2,4}},

{{1,2},{3,4}}, {{1,4},{2,3}}, {{1,3},{2,4}},

dont les deux bons (le deuxième et le troisième) ont été colorés en rouge. Ainsi, la réponse dans le cas est .n=2n=22/32/3

Nous pouvons représenter graphiquement ces partitions en traçant les points sur une droite numérique et dessiner des segments de ligne entre chaque et , en les décalant légèrement pour résoudre les chevauchements visuels. Voici des tracés des trois partitions précédentes, dans le même ordre avec la même coloration:{{li,ri},i=1,2,,n}{{li,ri},i=1,2,,n}{1,2,,2n}{1,2,,2n}liliriri

Figure 1

Dorénavant, afin de pouvoir adapter facilement de tels tracés dans ce format, je vais les tourner latéralement. Par exemple, voici les partitions pour , encore une fois avec les bonnes colorées en rouge:1515n=3n=3

Figure 2

Dix sont bons, donc la réponse pour est .n=3n=310/15=2/310/15=2/3

La première situation intéressante se produit lorsque . Maintenant, pour la première fois, il est possible que l'union des intervalles s'étende sur à sans qu'aucun d'entre eux ne coupe les autres. Un exemple est . L'union des segments de ligne fonctionne sans interruption de à mais ce n'est pas une bonne partition. Néanmoins, des partitions sont bonnes et la proportion reste .n=4n=4112n2n{{1,3},{2,5},{4,7},{6,8}}{{1,3},{2,5},{4,7},{6,8}}118870701051052/32/3


Le nombre de partitions augmente rapidement avec : il est égal à . L'énumération exhaustive de toutes les possibilités par continue de donner comme réponse. Les simulations de Monte-Carlo à (en utilisant itérations dans chacune) ne montrent aucun écart significatif par rapport aux .nn1352n1=(2n)!/(2nn!)1352n1=(2n)!/(2nn!)n=7n=72/32/3n=100n=10010000100002/32/3

Je suis convaincu qu'il existe un moyen simple et intelligent de démontrer qu'il existe toujours un rapport de bonnes partitions à de mauvaises partitions, mais je n'en ai pas trouvé. Une preuve est disponible grâce à une intégration minutieuse (en utilisant la distribution uniforme d'origine du ), mais elle est plutôt impliquée et peu éclairante.2:12:1XiXi

whuber
la source
Très cool. J'ai du mal à comprendre ce que signifie "conditionner sur les statistiques de commande", serait-il possible d'ajouter une ligne d'intuition? Cela semble être une technique utile. Je comprends jusqu'à ce que les soient échangeables, voire même , que cela nous permette d'envisager n'importe quelle permutation. XiXiiidiid
ekvall
1
@Student "Conditionner" signifie dire, maintenons temporairement ces valeurs fixes et considérons ce que nous pouvons en tirer. Plus tard, nous laisserons ces valeurs varier (selon leur distribution de probabilité). Dans ce cas, une fois que nous trouvons que la réponse est quelles que soient les valeurs fixes des statistiques de commande, alors nous n'avons plus à effectuer la deuxième étape de variation des statistiques de commande. Mathématiquement, les statistiques de commande sont une variable à valeur vectorielle et l'indicateur d'être bon est , donc2/32/3 XXYYE(Y)=E(E(Y|X))=E(2/3)=2/3.
E(Y)=E(E(Y|X))=E(2/3)=2/3.
whuber