Données de John Kerrich à retournement

12

Quelqu'un peut-il suggérer où obtenir les résultats des 10 000 lancers de pièces (c'est-à-dire les 10 000 têtes et queues) exécutés par John Kerrich pendant la Seconde Guerre mondiale?

Thomas
la source
1
Étant donné qu'il était enfermé dans une prison nazie à l'époque, je me demande s'il avait suffisamment de papier pour enregistrer tous les résultats de 10 000, ou s'il a seulement écrit les valeurs sommaires.
Corone du
6
Les résultats de @Corone 10K pourraient facilement être enregistrés sur une feuille de papier standard en utilisant, par exemple, un point et un code à barres (comme dans ||||..|....||.|..||.etc.). Cela peut être compressé en utilisant (par exemple) hexadécimal. Dans l'exemple précédent, |soit 1 et .0, la représentation hexadécimale est f21a6. En écrivant des caractères petits mais visibles, je peux facilement insérer 50 de ces caractères dans une ligne d'écriture et 50 lignes sur une feuille, représentant ainsi une séquence de 50 * 50 * 4 = résultats 10K.
whuber
2
@whuber haha, oui j'ai commencé à réfléchir à des choses similaires après mon commentaire. Je doute que dans l'ère pré-informatique, l'hexadécimal me soit venu à l'esprit comme il le fait maintenant, bien que l'octal vous donne toujours une chance. Pourtant, je l'ai essayé et les points et les tirets seuls, je pourrais obtenir plus de 100 sur une feuille, donc s'il utilisait les deux côtés, 10K conviendrait à peu près. C'est peut-être pour ça qu'il s'est arrêté à 10K!
Corone
Une prison nazie, oui, mais au Danemark, ce n'était pas un camp d'extermination ...
kjetil b halvorsen
@kjetilbhalvorsen - en fait un camp de prisonniers danois à Hald avec des gardes danois, etc. pour protéger les internés contre les Allemands
Henry

Réponses:

13

Je n'avais jamais entendu parler de Kerrich auparavant - quelle histoire bizarre. L'analyse du livre Google (partagée par reftt) de "Une introduction expérimentale à la théorie des probabilités" ne semble pas inclure le corps du texte. Me sentant un peu démodé, j'ai vérifié une copie de l'édition 1950 de la bibliothèque.

J'ai scanné quelques pages que j'ai trouvées intéressantes. Les pages décrivent ses conditions de test, les données des 2000 premiers lancers de pièces et les données des 500 premiers d'une série de 5000 expériences d'urnes au son tout aussi invraisemblable (avec 2 balles de ping-pong rouges et 2 vertes).


La reconnaissance de texte (et un certain nettoyage) à l'aide de Mathematica 9 donne cette séquence de 2000 queues (0) et têtes (1) du tableau 1. Le nombre de têtes de 1014 est un de plus de 502 + 511 = 1013 dans le tableau 2, donc la reconnaissance était imparfait, mais il semble assez bon - au moins, il a le bon nombre de caractères! (Les lecteurs aux yeux vifs sont invités à le corriger.)

Voici un résumé graphique de cette marche aléatoire, suivi des données elles-mêmes. La différence accumulée entre les dénombrements de la tête et de la queue se déroule de gauche à droite, couvrant l'ensemble des 2000 résultats.

Figure

00011101001111101000110101111000100111001000001110
00101010100100001001100010000111010100010000101101
01110100001101001010000011111011111001101100101011
01010000011000111001111101101010110100110110110110
01111100001110110001010010000010100111111011101011
10001100011000110001100110100100001000011101111000
11111110000000001101011010011111011110010010101100
11101101110010000010001100101100111110100111100010
00001001101011101010110011111011001000001101011111
11010001111110010111111001110011111111010000100000
00001111100101010111100001110111001000110100001111
11000101001111111101101110110111011010010110110011
01010011011111110010111000111101111111000001001001
01001110111011011011111100000101010101010101001001
11101101110011100000001001101010011001000100001100
10111100010011010110110111001101001010100000010000
00001011001101011011111000101100101000011100110011
11100101011010000110001001100010010001100100001001
01000011100000011101101111001110011010101101001011
01000001110110100010001110010011100001010000000010
10010001011000010010100011111101101111010101010000
01100010100000100000000010000001100100011011101010
11011000110111010110010010111000101101101010110110
00001011011101010101000011100111000110100111011101
10001101110000010011110001110100001010000111110100
00111111111111010101001001100010111100101010001111
11000110101010011010010111110000111011110110011001
11111010000011101010111101101011100001000101101001
10011010000101111101111010110011011110000010110010
00110110101111101011100101001101100100011000011000
01010011000110100111010000011001100011101011100001
11010111011110101101101111001111011100011011010000
01011110100111011001001110001111011000011110011111
01101011101110011011100011001111001011101010010010
10100011010111011000111110000011000000010011101011
10001011101000101111110111000001111111011000000010
10111111011100010000110000110001111101001110110000
00001111011100011101010001011000110111010001110111
10000010000110100000101000010101000101100010111100
00101110010111010010110010110100011000001110000111
Bill Bradley
la source
3
Je vous en prie. J'ai superposé un tracé de ces données sur votre image numérisée, en espérant que cela rendrait évidentes les divergences, mais je ne trouve aucune différence. Soit il n'y a pas d'erreurs et Kerrich a mal calculé ou je ne trouve tout simplement pas l'erreur, mais en tout cas les données affichées ici sont un rendu de texte précis de son tableau 1.
whuber
4

Cette présentation montre les données pour les intervalles définis de lancers. Il fait également référence à la source principale de Kerrich.


la source
2
La source des données (récapitulatives) de cette présentation est Freedman, Pisani, & Purves Statistics (toute édition). Il ne s'agit cependant que d'un résumé, et non d'un compte rendu de tous les résultats demandés ici. Kerrich a publié ses résultats en 1946 dans un petit livre; Google l'a numérisé .
whuber
Comme je l'ai dit, il contient des données sur les «intervalles de lancers» et la présentation fait référence à la monographie de Kerrich où il a publié ses résultats. Je ne sais pas si Kerrich a publié sa liste de tous les lancers. J'ai pensé que cela était au moins plus utile que la proportion globale.
@whuber: oui, c'était la monographie référencée dans la présentation. il semble avoir une disponibilité limitée. quelqu'un a-t-il trouvé un pdf?
2

Il y a une autre référence Kerrich dans le livre "Chance encounters: A First Course in Data Analysis and Inference" de Chris Wild et George Seber qui dit dans le chapitre 4 (peut télécharger le supplément à partir de cette page ) que les données sont publiées dans Kerrich [1964] et Freedman [1991, tableau 1, p. 248]. Le livre de Kerrich est probablement une introduction expérimentale à la théorie des probabilités , et Freedman est le même manuel déjà mentionné. Je doute cependant que la monographie de 1964 contienne plus de données que celle de 1946.

reftt
la source
2

Ce livre de Kerrich peut être acheté d'occasion sur Amazon, mais le prix indiqué est plutôt rigide!

Une meilleure option est https://openlibrary.org
Vous devez y créer un compte, puis installer Adobe Digital Editions pour lire le livre. (semble qu'aucun autre programme ne fera l'affaire, le livre téléchargé a DRM, gestion des restrictions numériques). Ensuite, vous pouvez télécharger ("emprunter") le livre. Je le lis tout à l'heure. Je suppose que je peux prendre une copie d'écran des pages avec les résultats et utiliser ocr là-dessus. Pour plus tard ...

(Non, j'ai parcouru rapidement le livre, il semble que seuls les 2000 premiers lancers soient donnés individuellement, mais il existe de nombreux tableaux variés avec des résumés des lancers. Il existe également des tableaux pour d'autres expériences, telles que dessiner des boules dans une urne , dans le même esprit.

kjetil b halvorsen
la source
3
Il n'est pas clair si vous avez remarqué que les 2000 premiers résultats individuels sont déjà disponibles dans ce fil à la réponse de Bill Bradley . Le livre apparaît dans Google books; J'ai fourni un lien dans un autre commentaire . Actuellement, Google établit des liens avec d'autres libraires, en plus d'Amazon, où le prix indiqué (y compris les frais d'expédition) est considérablement moins cher.
whuber
Merci, j'ai noté les 2000 lancers là où ils étaient disponibles ci-dessus, mais j'espérais pouvoir en trouver plus dans le livre lui-même. Ne semble pas. Je ne suis pas en mesure de lire le livre via Google Books, peut-être que l'accès dépend de la géographie? Au fait, j'ai maintenant rendu mon prêt à openlibrary, afin que d'autres puissent essayer ...
kjetil b halvorsen
1
J'ai tenté la même chose lorsque ce fil est apparu, avec les mêmes résultats négatifs. :-( Je ne voulais pas laisser entendre que nous pouvons réellement lire la version sur Google books: elle est uniquement consultable. La principale valeur de GB (au moins jusqu'à ce que la politique de Google change) est de fournir des liens vers des endroits où nous pourrions l'acheter.
whuber
1

Je suis tombé sur cela lors d'une recherche de base sur Kerrich. J'ai pris les données de la réponse de Bill Bradley - apprécie vraiment que les données aient été numérisées! J'ai ajouté les données au package R que j'utilise pour l'enseignement, qui est disponible sur GitHub .

chris prener
la source