Inspiré par la conférence de Peter Donnelly à TED , dans laquelle il explique combien de temps il faudrait pour qu'un certain motif apparaisse dans une série de lancers de pièces, j'ai créé le script suivant dans R. Étant donné deux modèles `` hth '' et `` htt '', il calcule le temps qu'il faut (c'est-à-dire le nombre de lancers de pièces) en moyenne avant de toucher l'un de ces motifs.
coin <- c('h','t')
hit <- function(seq) {
miss <- TRUE
fail <- 3
trp <- sample(coin,3,replace=T)
while (miss) {
if (all(seq == trp)) {
miss <- FALSE
}
else {
trp <- c(trp[2],trp[3],sample(coin,1,T))
fail <- fail + 1
}
}
return(fail)
}
n <- 5000
trials <- data.frame("hth"=rep(NA,n),"htt"=rep(NA,n))
hth <- c('h','t','h')
htt <- c('h','t','t')
set.seed(4321)
for (i in 1:n) {
trials[i,] <- c(hit(hth),hit(htt))
}
summary(trials)
Les statistiques sommaires sont les suivantes,
hth htt
Min. : 3.00 Min. : 3.000
1st Qu.: 4.00 1st Qu.: 5.000
Median : 8.00 Median : 7.000
Mean :10.08 Mean : 8.014
3rd Qu.:13.00 3rd Qu.:10.000
Max. :70.00 Max. :42.000
Dans l'exposé, il est expliqué que le nombre moyen de lancers de pièces serait différent pour les deux modèles; comme on peut le voir dans ma simulation. Malgré avoir regardé le discours à quelques reprises, je ne comprends toujours pas pourquoi ce serait le cas. Je comprends que «hth» se chevauche et intuitivement, je pense que vous frapperiez «hth» plus tôt que «htt», mais ce n'est pas le cas. J'apprécierais vraiment que quelqu'un puisse m'expliquer cela.
la source
Supposons que vous jetez la pièce fois et comptez le nombre de fois que vous voyez un motif "HTH" (y compris les chevauchements). Le nombre attendu est . Mais c'est aussi pour "HTT". Étant donné que peut se chevaucher et "HTT" ne peut pas, vous vous attendez à plus d'agglutination avec "HTH", ce qui augmente le temps prévu pour la première apparition de . n n H T H H T H8 n + 2 n n HTH HTH
Une autre façon de voir les choses est qu'après avoir atteint "HT", un "T" renverra "HTH" au début, tandis qu'un "H" commencera la progression vers un éventuel "HTT".
Vous pouvez calculer les deux temps prévus en utilisant l'algorithme de Conway [je pense], en examinant les chevauchements: si les premiers lancers du motif correspondent au dernier , alors ajoutez . Donc pour "HTH" vous obtenez comme attente et pour "HTT" vous obtenez , confirmant votre simulation.k 2 k 2 + 0 + 8 = 10 0 + 0 + 8 = 8k k 2k 2 + 0 + 8 = 10 0 + 0 + 8 = 8
La bizarrerie ne s'arrête pas là. Si vous avez une course entre les deux modèles, ils ont une probabilité égale d'apparaître en premier, et le temps prévu jusqu'à ce que l'un d'eux apparaisse est (un temps de plus que prévu pour obtenir "HT", après quoi l'un d'eux doit apparaître) .5
Cela empire: dans le jeu de Penney, vous choisissez un modèle pour courir, puis j'en choisis un autre. Si vous choisissez "HTH", je choisirai "HHT" et j'aurai une chance de gagner 2: 1; si vous choisissez "HTT", je choisirai à nouveau "HHT" et j'ai toujours une cote de 2: 1 en ma faveur. Mais si vous choisissez "HHT", je choisirai "THH" et j'aurai une cote de 3: 1. Le deuxième joueur peut toujours biaiser les cotes et les meilleurs choix ne sont pas transitifs.
la source
J'aime dessiner des images.
Ces diagrammes sont des automates à états finis (FSA). Ce sont de minuscules jeux pour enfants (comme des chutes et des échelles ) qui "reconnaissent" ou "acceptent" les séquences HTT et HTH, respectivement, en déplaçant un jeton d'un nœud à un autre en réponse aux lancers de pièces. Le jeton commence au nœud supérieur, indiqué par une flèche (ligne i ). Après chaque lancement de la pièce, le jeton est déplacé le long du bord étiqueté avec le résultat de cette pièce (soit H ou T) vers un autre nœud (que j'appellerai respectivement "nœud H" et "nœud T"). Lorsque le jeton atterrit sur un nœud terminal (pas de flèches sortantes, indiquées en vert), le jeu est terminé et la FSA a accepté la séquence.
Considérez chaque FSA comme progressant verticalement sur une piste linéaire. Lancer la "bonne" séquence de têtes et de queues fait progresser le jeton vers sa destination. Lancer une valeur "erronée" provoque la sauvegarde du jeton (ou au moins reste immobile). Le jeton sauvegarde à l'état le plus avancé correspondant aux lancements les plus récents. Par exemple, le HTT FSA à la ligne ii reste sur la ligne ii après avoir vu une tête, car cette tête pourrait être la séquence initiale d'une éventuelle HTH. Il ne pas aller tout le dos de chemin vers le début, parce que cela ignorer efficacement cette dernière tête tout à fait.
Après avoir vérifié ces deux jeux correspondent en effet à HTT et HTH comme revendiqué, et les avoir comparés ligne par ligne, et il devrait maintenant être évident que HTH est plus difficile à gagner . Ils ne diffèrent dans leur structure graphique que sur la ligne iii , où un H ramène HTT à la ligne ii (et un T accepte) mais, dans HTH, un T nous ramène à la ligne i (et un H accepte). La pénalité à la ligne iii en jouant HTH est plus sévère que la pénalité en jouant HTT.
Cela peut être quantifié. J'ai étiqueté les nœuds de ces deux FSA avec le nombre attendu de lancers nécessaires pour l'acceptation. Appelons-les le nœud "valeurs". L'étiquetage commence par
Soit la probabilité des têtes p (H) et la probabilité des queues 1 - p (H) = p (T). (Pour une pièce équitable, les deux probabilités sont égales à 1/2.) Parce que chaque lancer de pièce ajoute un au nombre de lancers,
Ces règles déterminent les valeurs . C'est un exercice rapide et instructif pour vérifier que les valeurs étiquetées (en supposant une pièce équitable) sont correctes. À titre d'exemple, considérons la valeur de HTH à la ligne ii . La règle dit que 8 doit être 1 de plus que la moyenne de 8 (la valeur du nœud H sur la ligne i ) et 6 (la valeur du nœud T sur la ligne iii ): bien sûr, 8 = 1 + (1/2) * 8 + (1/2) * 6. Vous pouvez tout aussi facilement vérifier les cinq valeurs restantes dans l'illustration.
la source
De bonnes réponses. Je voudrais adopter une approche légèrement différente et aborder la question de la contre-intuitivité. (Je suis tout à fait d'accord, BTW)
Voici comment je comprends cela. Imaginez une colonne de résultats de tirage au sort séquentiels aléatoires imprimés sur une bande de papier, composée des lettres "H" et "T".
Détachez arbitrairement une section de cette bande et faites une copie identique.
Sur une bande donnée, la séquence HTH et la séquence HTT se produiront chacune aussi souvent, si la bande est suffisamment longue.
Mais parfois, les instances HTH fonctionneront ensemble, c'est-à-dire HTHTH. (ou même très occasionnellement HTHTHTH)
Ce chevauchement ne peut pas se produire avec les instances HTT.
Utilisez un surligneur pour sélectionner les «rayures» des résultats positifs, HTH sur une bande et HTT sur l'autre. Quelques-unes des bandes HTH seront plus courtes en raison du chevauchement. Par conséquent, les écarts entre eux, en moyenne, seront légèrement plus longs que sur l'autre bande.
C'est un peu comme attendre un bus, alors qu'en moyenne il y en a un toutes les cinq minutes. Si les bus sont autorisés à se chevaucher, l'intervalle sera légèrement plus long que cinq minutes, en moyenne, car parfois deux passeront ensemble.
Si vous arrivez à une heure arbitraire, vous attendrez un peu plus longtemps le prochain (à vous, premier) bus, en moyenne, s'ils sont autorisés à se chevaucher.
la source
Je cherchais l'intuition à cela dans le cas entier (alors que je fouille dans l'introduction de Ross aux modèles de probabilité). Je pensais donc aux cas entiers. J'ai trouvé que cela aidait:
Alors, laissez-moi imaginer que j'ai la chance de terminer le motif au prochain tirage. Je dessine le symbole suivant et il ne termine pas le motif. Dans le cas où mon motif ne se chevaucherait pas, le symbole dessiné pourrait encore me permettre de recommencer la construction du motif depuis le début.
Dans le cas d'un chevauchement, le symbole dont j'avais besoin pour terminer mon motif partiel était le même que le symbole dont j'avais besoin pour commencer la reconstruction. Je ne peux donc pas faire non plus, et par conséquent, j'aurai certainement besoin d'attendre le prochain tirage pour avoir une chance de recommencer à construire.
la source