Je suis tombé sur une question lors d'un test d'aptitude à l'entretien critique lors d'un entretien d'embauche. C'est quelque chose comme ça:
La République Zorganienne a des coutumes très étranges. Les couples souhaitent seulement avoir des enfants de sexe féminin, car seules les femmes peuvent hériter de la richesse de la famille. Par conséquent, s'ils ont un enfant de sexe masculin, ils continuent d'avoir plus d'enfants jusqu'à ce qu'ils aient une fille. S'ils ont une fille, ils cessent d'avoir des enfants. Quel est le ratio filles / garçons à Zorgania?
Je ne suis pas d'accord avec le modèle de réponse donné par l'auteur de la question, qui est d'environ 1: 1. La justification est que toute naissance aura toujours 50% de chances d'être un homme ou une femme.
Pouvez-vous me convaincre avec une réponse plus mathématique plus vigoureuse de si est le nombre de filles et B le nombre de garçons dans le pays?
la source
Réponses:
Commencez sans enfants
répéter l'étape
{
Chaque couple qui a encore des enfants a un enfant. La moitié des couples ont des hommes et la moitié des couples ont des femmes.
Les couples qui ont des femmes cessent d'avoir des enfants
}
A chaque étape, vous obtenez un nombre pair d'hommes et de femmes et le nombre de couples ayant des enfants est réduit de moitié (c'est-à-dire que ceux avec des femmes n'auront aucun enfant à l'étape suivante)
Donc, à tout moment, vous avez un nombre égal d'hommes et de femmes et, étape après étape, le nombre de couples ayant des enfants diminue de moitié. Alors que plus de couples sont créés, la même situation se reproduit et toutes choses étant égales par ailleurs, la population contiendra le même nombre d'hommes et de femmes.
la source
Soit le nombre de garçons dans une famille. Dès qu'ils ont une fille, ils s'arrêtent, alorsX
Si est la probabilité qu'un enfant soit un garçon et si les sexes sont indépendants entre les enfants, la probabilité qu'une famille finisse par avoir garçons est de c’est-à-dire la probabilité d’avoir garçons puis d’avoir une fille. Le nombre attendu de garçons est Notant que nous obtenons k P ( X = k ) = p k ⋅ ( 1 - p ) , k E X = ∞ Σ k = 0 k p k ⋅ ( 1 - p ) = ∞ Σ k = 0 k p k - ∞ Σ k = 0 k p k + 1 . ∞ Σ k =p k
Si , nous avons ce . C'est-à-dire que la famille moyenne a 1 garçon. Nous savons déjà que toutes les familles ont 1 fille, de sorte que le rapport sera même à terme de .E X = 0,5 / 0,5 1 / 1 = 1p=1/2 EX=0.5/0.5 1/1=1
La variable aléatoire est appelée variable aléatoire géométrique .X
la source
p
c'est la même chose pour toutes les familles. Si au contraire nous supposons que certains couples sont plus susceptibles d'avoir des garçons que d'autres ( c'est-à - dire que leur nombrep
est plus élevé), le résultat change, même si la valeur moyennep
est de 0,5. (C'est quand même une excellente explication des statistiques de base sous-jacentes.)Sommaire
Le modèle simple selon lequel toutes les naissances, indépendamment l'une de l'autre, ont 50% de chances d'être des filles est irréaliste et, en fin de compte, exceptionnel. Dès que nous considérons les conséquences de la variation des résultats parmi la population, la réponse est que le rapport filles: garçons peut être n’importe quelle valeur ne dépassant pas 1: 1. (En réalité, il serait probablement encore proche de 1: 1, mais c'est une question d'analyse de données à déterminer.)
Parce que ces deux réponses contradictoires sont obtenues en supposant l'indépendance statistique des résultats de naissance, un appel à l'indépendance est une explication insuffisante. Il apparaît donc que la variation (dans les chances de naissance d'une femme) est l'idée clé du paradoxe.
introduction
Un paradoxe se produit lorsque nous pensons avoir de bonnes raisons de croire quelque chose, mais que nous sommes confrontés à un argument solide qui montre le contraire.
Une solution satisfaisante à un paradoxe nous aide à comprendre à la fois ce qui était correct et ce qui aurait pu être faux sur les deux arguments. Comme c'est souvent le cas dans les probabilités et les statistiques, les deux arguments peuvent en réalité être valides: la résolution dépendra des différences implicites entre les hypothèses . La comparaison de ces différentes hypothèses peut nous aider à identifier les aspects de la situation qui conduisent à des réponses différentes. Je maintiens que l’identification de ces aspects est ce qui nous importe le plus.
Hypothèses
Comme le prouvent toutes les réponses publiées jusqu'à présent, il est naturel de supposer que les naissances féminines se produisent indépendamment et avec des probabilités constantes de . Il est bien connu qu'aucune des hypothèses n'est en réalité vraie, mais il semblerait que de légers écarts par rapport à ces hypothèses ne devraient pas affecter beaucoup la réponse. Voyons. À cette fin, considérons le modèle plus général et plus réaliste suivant:1/2
Dans chaque famille la probabilité d'une naissance féminine est une constante , quel que soit l' ordre de naissance.i pi
En l’absence de règle d’arrêt, le nombre prévu de naissances féminines dans la population devrait être proche du nombre prévu de naissances masculines.
Tous les résultats de la naissance sont indépendants (statistiquement).
Ce n’est pas encore un modèle totalement réaliste de naissances humaines, dans lequel le peut varier en fonction de l’âge des parents (en particulier de la mère). Cependant, il est suffisamment réaliste et flexible pour permettre une résolution satisfaisante du paradoxe qui s’appliquera même à des modèles plus généraux.pi
Une analyse
Bien qu’il soit intéressant de procéder à une analyse approfondie de ce modèle, les points principaux deviennent évidents même lorsqu’une version spécifique, simple (mais un peu extrême) est envisagée. Supposons que la population compte familles. Dans la moitié de ces cas, les chances de naissance d'une femme sont de et dans l'autre moitié, les chances de naissance d'une femme sont de . Cela répond clairement à la condition (2): les nombres attendus de naissances féminines et masculines sont les mêmes.2N 2/3 1/3
Considérons ces premières familles. Raisons raisonner en termes d'attentes, sachant que les résultats réels seront aléatoires et varieront donc un peu des attentes. (L'idée qui sous-tend l'analyse suivante a été exprimée plus brièvement et simplement dans la réponse originale qui apparaît à la toute fin de ce message.)N
Soit le nombre attendu de naissances féminines dans une population de avec une probabilité de naissance féminine constante . Évidemment , cela est proportionnelle à et si on peut écrire . De même, supposons que soit le nombre attendu de naissances masculines.f(N,p) N p N f(N,p)=f(p)N m(p)N
Les premières familles produisent une fille et s'arrêtent. Les autres familles ont un garçon et continuent d'avoir des enfants. C'est filles et garçons jusqu'à présent.pN (1−p)N pN (1−p)N
Les familles restantes sont dans la même situation qu'auparavant:(1−p)N l'hypothèse d'indépendance (3) implique que ce qu'elles vivent dans le futur n'est pas affecté par le fait que leur premier-né était un fils. Ainsi, ces familles produiront plus de filles plus de garçons .f(p)[(1−p)N] m(p)[(1−p)N]
En additionnant le nombre total de filles et de garçons et en comparant à leurs valeurs supposées de et obtient des équations.f(p)N m(p)N
avec des solutions
Le nombre attendu de filles dans les premières familles , avec , est donc et le nombre attendu de garçons est .N p=2/3 f(2/3)N=N m(2/3)N=N/2
Le nombre attendu de filles dans les secondes familles , avec , est donc et le nombre attendu de garçons est .N p=1/3 f(1/3)N=N m(1/3)N=2N
Les totaux sont filles et garçons. Pour le grand le ratio attendu sera proche du ratio des attentes,(1+1)N=2N (1/2+2)N=(5/2)N N
La règle d'arrêt favorise les garçons!
Plus généralement, avec la moitié des familles ayant des filles indépendamment avec la probabilité et l’autre moitié ayant des garçons indépendamment avec la probabilité , les conditions (1) à (3) continuent de s’appliquer et le ratio attendu pour les grandes approches dep 1−p N
En fonction de , qui est bien sûr compris entre et , cette valeur peut être comprise entre et (mais jamais supérieure à ). Il n'atteint son maximum de que lorsque . En d’autres termes, un ratio filles / garçons escompté de 1: 1 est une exception particulière à la règle plus générale et réaliste voulant que s’arrêter avec la première fille favorise un plus grand nombre de garçons dans la population.0 1 0 1 1 1 p = 1 / 2p 0 1 0 1 1 1 p=1/2
Résolution
Si votre intuition est que si vous arrêtez avec la première fille devrait produire plus de garçons dans la population, alors vous avez raison, comme le montre cet exemple. Pour être correct, tout ce dont vous avez besoin, c'est que la probabilité de donner naissance à une fille varie (même légèrement) entre les familles.
La réponse "officielle", selon laquelle le rapport devrait être proche de 1: 1, nécessite plusieurs hypothèses irréalistes et y est sensible: cela suppose qu'il ne peut y avoir de variation entre les familles et que toutes les naissances doivent être indépendantes.
commentaires
L'idée clé mise en évidence par cette analyse est que la variation au sein de la population a des conséquences importantes. L'indépendance des naissances - bien que ce soit une hypothèse simplificatrice utilisée pour chaque analyse de ce fil - ne résout pas le paradoxe, car (selon les autres hypothèses), elle est cohérente à la fois avec la réponse officielle et son contraire.
Notez cependant que pour que le ratio attendu s'écarte sensiblement de 1: 1, il faut beaucoup de variation parmi les de la population. Si tous les sont, par exemple, compris entre 0,45 et 0,55, les effets de cette variation ne seront pas très perceptibles. Aborder cette question de ce que sont réellement les dans une population humaine nécessite un ensemble de données assez volumineux et précis. On pourrait utiliser un modèle mixte linéaire généralisé et tester la surdispersion .p i p ipi pi pi
Si nous remplaçons le genre par une autre expression génétique, nous obtiendrons alors une explication statistique simple de la sélection naturelle : une règle qui limite de manière différenciée le nombre de descendants en fonction de leur constitution génétique peut modifier systématiquement les proportions de ces gènes dans la génération suivante. Lorsque le gène n'est pas lié au sexe, même un faible effet sera multiplié par multiplication sur des générations successives et peut rapidement devenir considérablement amplifié.
Réponse originale
Chaque enfant a un ordre de naissance: premier-né, deuxième-né, etc.
En supposant des probabilités égales de naissances masculines et féminines et aucune corrélation entre les sexes, la loi sur les grands nombres faibles affirme qu'il y aura un ratio de près de 1: 1 entre les femmes premier - né et les hommes. Pour la même raison, il y aura un ratio proche de 1: 1 de femmes nées en deuxième naissance par rapport aux hommes, etc. Étant donné que ces ratios sont constamment de 1: 1, le ratio global doit également être de 1: 1, quelles que soient les fréquences relatives des ordres de naissance dans la population.
la source
La naissance de chaque enfant est un événement indépendant avec P = 0,5 pour un garçon et P = 0,5 pour une fille. Les autres détails (tels que les décisions familiales) ne font que vous distraire de ce fait. La réponse est donc que le rapport est de 1: 1 .
Pour expliquer cela: imaginez qu'au lieu d'avoir des enfants, vous jetez une pièce équitable (P (têtes) = 0,5) jusqu'à ce que vous obteniez une "tête". Disons que la famille A lance la pièce et obtient la séquence [queues, queues, têtes]. Ensuite, la famille B lance la pièce et prend une queue. Maintenant, quelle est la probabilité que les prochaines soient des têtes? Encore 0,5 , parce que c'est ce que signifie indépendant . Si vous deviez faire cela avec 1 000 familles (ce qui signifie 1 000 têtes montées), le nombre total de queues attendu est de 1 000, car chaque basculement (événement) était complètement indépendant.
Certaines choses ne sont pas indépendantes, telles que la séquence au sein d'une famille: la probabilité de la séquence [têtes, têtes] est égale à 0, différente de [queue, queue] (0.25). Mais puisque la question ne se pose pas à ce sujet, ce n'est pas pertinent.
la source
Imaginez lancer une pièce juste jusqu'à ce que vous observiez une tête. Combien de queues jetez-vous?
Le nombre attendu de queues est facilement calculé * pour être égal à 1.
Le nombre de têtes est toujours 1.
* si ce n'est pas clair pour vous, voir 'aperçu de la preuve' ici
la source
Les couples avec exactement une fille et aucun garçon sont les plus communs
La raison pour laquelle tout cela fonctionne est que la probabilité d'un scénario dans lequel il y a plus de filles est beaucoup plus grande que celle où il y a plus de garçons. Et les scénarios où il y a beaucoup plus de garçons ont de très faibles probabilités. La façon dont cela fonctionne est illustré ci-dessous
Vous pouvez à peu près voir où cela se passe à ce stade, le nombre total de filles et de garçons va correspondre à un.
Filles attendues d'un couple garçons attendus d'un couple=∑∞n=1(12n)=1
=∑∞n=1(n−1n2)=1
Limiter les solutions de wolfram
Toute naissance, quelle que soit sa famille, a 50% de chances d'être un garçon ou une fille
Tout cela a un sens intrinsèque car (comme le pourraient les couples), vous ne pouvez pas contrôler la probabilité qu'une naissance spécifique soit un garçon ou une fille. Peu importe qu'un enfant naisse d'un couple sans enfants ou d'une famille de cent garçons; la chance est de 50:50 donc si chaque naissance individuelle a une chance de 50:50, alors vous devriez toujours avoir la moitié des garçons et la moitié des filles. Et peu importe comment vous mélangez les naissances entre les familles; tu ne vas pas affecter cela.
Cela fonctionne pour toute règle 1
En raison de la possibilité de 50:50 pour toute naissance, le rapport finira par 1: 1 pour toute règle ( 1 raisonnable ) que vous pouvez énoncer. Par exemple, la règle similaire ci-dessous fonctionne également même
Dans ce cas, le total des enfants attendus est plus facilement calculé
Filles attendues d'un couple attendues d'un couple=0.5⋅1+0.25⋅1=0.75
=0.25⋅1+0.25⋅2=0.75
1 Comme je l'ai dit, cela fonctionne pour toute règle raisonnable pouvant exister dans le monde réel. Une règle déraisonnable serait une règle dans laquelle les enfants attendus par couple étaient infinis. Par exemple, "Les parents ne cessent d'avoir des enfants que lorsqu'ils ont deux fois plus de garçons que de filles", nous pouvons utiliser les mêmes techniques que ci-dessus pour montrer que cette règle donne aux enfants une infinité:
On peut alors trouver le nombre de parents avec un nombre fini d'enfants
Nombre attendu de parents avec enfants finis=∑∞m=1(11/(3m)2)=π254=0.18277….
Limiter les solutions de wolfram
Nous pouvons donc établir que 82% des parents auraient un nombre infini d’enfants; du point de vue de l'urbanisme, cela poserait probablement des problèmes et montrerait que cette situation ne pourrait pas exister dans le monde réel.
la source
Vous pouvez également utiliser la simulation:
la source
mean(rgeom(10000, 0.5))
Cartographier cela m'a permis de mieux comprendre comment le ratio de la population à la naissance (supposée être de 1: 1) et celui de la population d'enfants seraient tous deux de 1: 1. Alors que certaines familles auraient plusieurs garçons mais une seule fille, ce qui m’avait initialement amené à penser qu’il y aurait plus de garçons que de filles, le nombre de ces familles ne serait pas supérieur à 50% et diminuerait de moitié avec chaque enfant supplémentaire, le nombre de familles avec une seule fille serait de 50%. Le nombre de garçons et de filles s'équilibrerait donc. Voir les totaux de 175 en bas.
la source
Ce que tu as eu était le plus simple et une réponse correcte. Si la probabilité qu'un nouveau-né soit un garçon est p, et que les enfants du mauvais sexe ne rencontrent pas d'accidents malheureux, alors peu importe si les parents décident d'avoir plus d'enfants en fonction de leur sexe. Si le nombre d'enfants est N et que N est grand, vous pouvez vous attendre à environ p * N garçons. Il n'y a pas besoin d'un calcul plus compliqué.
Il y a certainement d'autres questions, telles que "quelle est la probabilité que le dernier-né d'une famille avec enfants soit un garçon" ou "quelle est la probabilité que l'aîné des enfants d'une famille avec enfants soit un garçon". (L’un d’eux a une réponse correcte simple, l’autre une réponse fausse simple et obtenir une réponse correcte est délicat).
la source
Laisser
être l'espace échantillon et laisser
soit la variable aléatoire qui mappe chaque résultat, , sur le nombre de garçons qu’il implique. La valeur attendue des garçons, , revient alors àω E(X)
Essentiellement, la valeur attendue des filles est de 1. Le ratio est donc de 1 également.
la source
C'est une question piège. Le rapport reste le même (1: 1). La bonne réponse est que cela n’affecte pas le taux de natalité, mais bien le nombre d’enfants par famille avec un facteur limitant de 2 naissances en moyenne par famille.
C'est le genre de question que vous pourriez trouver lors d'un test logique. La réponse ne concerne pas le taux de natalité. C'est une distraction.
Ce n'est pas une question de probabilité, mais une question de raisonnement cognitif. Même si vous avez répondu au ratio 1: 1, vous avez quand même échoué au test.
la source
Je montre le code que j'ai écrit pour une simulation Monte Carlo (familles 500x1000) en utilisant le logiciel `MATLAB '. S'il vous plaît examiner le code afin que je ne me suis pas trompé.
Le résultat est généré et tracé ci-dessous. Cela montre que la probabilité de naissance simulée est en très bon accord avec la probabilité de naissance naturelle sous-jacente, quelle que soit la règle d’arrêt pour une plage de probabilité de naissance naturelle.
En jouant avec le code, il est plus facile de comprendre un point que je n'avais pas encore bien compris - comme le soulignent les autres, la règle d'arrêt est une distraction. La règle d’arrêt ne concerne que le nombre de familles pour une population déterminée ou, d’un autre point de vue, le nombre de naissances d’enfants pour un nombre fixe de familles. Le sexe est uniquement déterminé par les dés et le ratio ou la probabilité (qui est indépendante du nombre d'enfants) dépendra uniquement du garçon naturel: le taux de naissance de la fille.
la source
Laissez la variable aléatoire indiquant le enfant dans le pays soit prend des valeurs 1 et 0 si l'enfant est un garçon ou une fille , respectivement. Supposons que la probabilité marginale que chaque naissance soit un garçon ou une fille est de .ith Xi 0.5
Le nombre attendu de garçons dans le pays = (où est le nombre d'enfants dans le pays.)E[∑iXi]=∑iE[Xi]=0.5n n
De même, le nombre attendu de filles = .E[∑i(1−Xi)]=∑iE[1−Xi]=0.5n
L'indépendance des naissances n'est pas pertinente pour le calcul des valeurs attendues.
Réponse de Apropos @ whuber, s'il existe une variation de la probabilité marginale selon les familles, le rapport devient biaisé en faveur des garçons, car il y a plus d'enfants dans les familles à probabilité plus élevée que les familles à probabilité plus faible, ce qui a pour effet d'augmenter la somme de valeur attendue pour les garçons.
la source
J'ai également programmé de manière indépendante une simulation dans matlab, avant de voir ce que les autres ont fait. Strictement parlant, ce n'est pas un MC car je ne fais l'expérience qu'une fois. Mais une fois suffit pour obtenir des résultats. Voici ce que ma simulation rapporte. Je ne prends pas position sur la probabilité que les naissances soient p = 0,5 en primitif. Je laisse la probabilité de naissance varier sur une plage de Pr (garçons = 1) = 0,25: 0,05: 0,75.
Mes résultats montrent que lorsque la probabilité s'écarte de p = 0,5, le sex-ratio est différent de 1: dans l'attente, le sex-ratio est tout simplement le rapport entre la probabilité de naissance d'un garçon et la probabilité de naissance d'une fille. C'est-à-dire qu'il s'agit d'une variable aléatoire géométrique, identifiée précédemment par @ månst. C'est ce que je crois que l'affiche originale était intuitive.
Mes résultats imitent de près ce que l'affiche ci-dessus avec le code matlab a faite, en faisant correspondre les sex-ratios aux probabilités de naissance d'un garçon de 0,45, 0,50 et 0,55. Je présente le mien en adoptant une approche légèrement différente pour obtenir les résultats avec un code plus rapide. Pour effectuer la comparaison, j’ai omis la section de code vec = vec (randperm (s, N)) car s n’est pas défini dans leur code et je ne connais pas l’intention initiale de cette variable (cette section de code semble également superflue - comme à l’origine déclaré).
Je poste mon code
Le graphique suivant est attendu compte tenu de la loi forte du grand nombre. Je le reproduis, mais le graphique qui compte est le deuxième.
Ici, une probabilité de population autre que 0,5 pour la naissance de l’un ou l’autre sexe de l’enfant modifiera le sex-ratio dans la population globale. En supposant que les naissances soient indépendantes (mais pas le choix de continuer à se reproduire), à chaque cycle de reproduction conditionnelle, la probabilité démographique gouverne la composition générale des résultats des naissances des garçons et des filles. Ainsi, comme d'autres l'ont mentionné, la règle d'arrêt du problème est sans conséquence sur le résultat obtenu pour la population, comme l'a répondu l'affiche qui l'a identifiée comme étant la distribution géométrique.
Pour être complet, ce que la règle d’arrêt affecte, c’est le nombre de tours de reproduction dans la population. Comme je n’exécute l’expérience qu’une seule fois, le graphique est un peu irrégulier. Mais l’intuition est là: pour une taille de population donnée, à mesure que la probabilité de naissance d’une fille augmente, nous constatons que les familles ont besoin de moins de cycles de reproduction pour obtenir la fille souhaitée avant que toute la population ne cesse de se reproduire (évidemment, le nombre de tours dépendra de la la taille de la population, car cela augmente mécaniquement la probabilité qu'une famille ait, par exemple, 49 garçons avant d'avoir leur première fille)
La comparaison entre mes sex-ratios calculés:
et ceux de l'affiche précédente avec le code matlab:
Ce sont des résultats équivalents.
la source
Cela dépend du nombre de familles.
Soit le nombre d’enfants d’une famille, c’est une variable géométrique aléatoire avec , c’est-à-dire que ce qui impliqueX p=0.5
Supposons qu'il y a familles dans le pays, le taux de filles est deN
Puisque (loi du grand nombre), le rapport couvre 1/2 si .∑Xi/N→E(X)=2 N→∞
S'il n'y a que des familles finies, soit le nombre total d'enfants du pays: , alors a une distribution binomiale négative avec pmfT T=∑Xi T
Cela implique que où est la fonction hypergéométrique.2F1
Par conséquent, le nombre de filles attendu est .2F1(N,1,N+1,−1)
la source