Quelle est la probabilité que je descende d'une personne née en 1300?

26

En d'autres termes, sur la base de ce qui suit, qu'est-ce que p?

Afin d'en faire un problème mathématique plutôt que l'anthropologie ou les sciences sociales, et pour simplifier le problème, supposons que les partenaires sont sélectionnés avec une probabilité égale dans l'ensemble de la population, sauf que les frères et sœurs et les cousins ​​germains ne s'accouplent jamais, et les partenaires sont toujours sélectionnés parmi les mêmes génération.

  • n1 - population initiale
  • g - le nombre de générations.
  • c - le nombre moyen d'enfants par couple. (Si nécessaire pour la réponse, supposez que chaque couple a exactement le même nombre d'enfants.)
  • z - le pourcentage de personnes qui n'ont pas d'enfants et qui ne sont pas considérées comme faisant partie d'un couple.
  • n2 - population à la dernière génération. (Soitn2 ouz doit être donné, et (je pense) l'autre peut être calculé.)
  • p - probabilité qu'une personne de la génération finale descende d'une personne particulière de la génération initiale.

Ces variables peuvent être modifiées, omises ou ajoutées, bien sûr. Je suppose par souci de simplicité que c et z ne changent pas avec le temps. Je sais que cela obtiendra une estimation très approximative, mais c'est un point de départ.

Partie 2 (suggestion de recherches supplémentaires):

Comment pouvez-vous considérer que les partenaires ne sont pas sélectionnés avec une probabilité globalement uniforme? En réalité, les partenaires sont plus susceptibles d'être de la même zone géographique, milieu socio-économique, race et origine religieuse. Sans rechercher les probabilités réelles pour cela, comment les variables de ces facteurs entreraient-elles en jeu? Quelle importance cela aurait-il?

xpda
la source
2
Est-ce que c'est une question d'un devoir? Sinon, quel est le contexte?
David LeBauer
1
@John: Merci pour votre modification. Je crois que le consensus qui prévaut (sur ce site et sur d'autres) est que nous ne modifions pas les questions simplement pour ajouter la homeworkbalise. Il vaut mieux pour toutes les personnes impliquées de laisser le PO faire cela. Vous pourriez être intéressé par ce fil méta si vous ne l'avez pas déjà vu.
cardinal
Je suis juste curieux. Je ne suis pas étudiant et ce n'est le devoir de personne. Je plaisantais simplement sur le crédit supplémentaire, même si je peux voir comment cela impliquerait des devoirs.
xpda
3
ff=(n1)/nnfn=108f032600800
whuber
1
Je crois qu'il y a des recherches universitaires sur la probabilité qu'un nom de famille unique disparaisse. Bien qu'il ne soit pas identique au problème posé, cela pourrait fournir des informations intéressantes (mais malheureusement, je ne me souviens pas d'où il vient). Curieusement, je crois que ces études ont permis de comprendre les mathématiques derrière la propagation des maladies infectieuses ...
Michael McGowan

Réponses:

13

Parce que cette question reçoit des réponses qui varient d'astronomiquement petites à près de 100%, je voudrais offrir une simulation pour servir de référence et d'inspiration pour des solutions améliorées.

J'appelle ces «complots de flammes». Chacun documente la dispersion du matériel génétique au sein d'une population telle qu'elle se reproduit en générations discrètes. Les tracés sont des tableaux de minces segments verticaux représentant des personnes. Chaque ligne représente une génération, la première en haut. Les descendants de chaque génération sont dans la rangée juste en dessous.

n

Voici un tableau de 20 résultats de simulation indépendants.

Parcelles de flammes

Le matériel génétique rouge s'est finalement éteint dans neuf de ces simulations, laissant les survivants dans les 11 autres (55%). (Dans un scénario, en bas à gauche, il semble que toute la population soit finalement morte.) Partout où il y avait des survivants, cependant, presque toute la population contenait du matériel génétique rouge. Cela prouve que la probabilité qu'un individu sélectionné au hasard de la dernière génération contenant le gène rouge soit d'environ 50%.

La simulation fonctionne en déterminant au hasard une survie et un taux de natalité moyen au début de chaque génération. La survie est tirée d'une distribution bêta (6,2): elle est en moyenne de 75%. Ce nombre reflète à la fois la mortalité avant l'âge adulte et les personnes n'ayant pas d'enfants. Le taux de natalité est tiré d'une distribution gamma (2,8, 1), il est donc en moyenne de 2,8. Le résultat est une histoire brutale de capacité de reproduction insuffisante pour compenser une mortalité généralement élevée. Il s'agit d'un modèle extrêmement pessimiste dans le pire des cas - mais (comme je l'ai suggéré dans les commentaires), la capacité de croissance de la population n'est pas essentielle. Tout ce qui compte à chaque génération, c'est la proportion de rouge dans la population.

Pour modéliser la reproduction, la population actuelle est réduite aux survivants en prélevant un simple échantillon aléatoire de la taille souhaitée. Ces survivants sont appariés au hasard (tout survivant étrange restant après l'appariement ne parvient pas à se reproduire). Chaque paire produit un nombre d'enfants tirés d'une distribution de Poisson dont la moyenne est le taux de natalité de la génération. Si l' un des parents contient le marqueur rouge, tous les enfants en héritent: cela modélise l'idée de descendance directe par l'un ou l'autre des parents.

n=8214=16,384log2(n)

Une survie de 75% ou moins dans une génération n'est d'ailleurs pas fantaisiste. À la fin de 1347, des rats infestés de peste bubonique ont fait leur chemin d'Asie en Europe; au cours des trois prochaines années, entre 10% et 50% de la population européenne est décédée. La peste est réapparue presque une fois par génération pendant des centaines d'années après (mais généralement pas avec la même mortalité extrême).


Code

La simulation a été créée avec Mathematica 8:

randomPairs[s_List] := Partition[s[[Ordering[RandomReal[{0, 1}, Length[s]]]]], 2];

next[s_List, survive_, nKids_] := Flatten[ConstantArray[Max[#], 
   RandomVariate[PoissonDistribution[nKids]]] & /@ 
   randomPairs[RandomSample[s, Ceiling[survive Length[s]]]]] 

Partition[Table[
   With[{n = 6}, ArrayPlot[NestList[next[#, RandomVariate[BetaDistribution[6, 2]], 
        RandomVariate[GammaDistribution[3.2, 1]]] &, 
        Join[ConstantArray[0, 2^n - 1], ConstantArray[1, 1]], n + 2], 
     AspectRatio -> 2^(n/3)/(2 n), 
     ColorRules -> {1 -> RGBColor[.6, .1, .1]},  
     Background -> RGBColor[.9, .9, .9]]
    ], {i, 1, 20}
   ], 4] // TableForm
whuber
la source
1
Je pense que la modélisation comme celle-ci peut être la meilleure approche. C'est beaucoup plus simple et plus amusant (pour moi) que les mathématiques, et cela devrait faciliter beaucoup l'introduction de facteurs limitant la sélection des partenaires. Avez-vous des recommandations, des mises en garde ou d'autres conseils avant de me lancer là-dessus?
xpda
3
@xpda Les solutions mathématiques donneront un aperçu de ce qui compte et de ce qui ne l'est pas. Par exemple, ils montreront que vous n'avez pas nécessairement besoin de modéliser d'énormes populations. Ils indiqueront également le rôle joué par la variabilité, qui est plus difficile à gérer analytiquement et apparaît au premier plan dans une simulation.
whuber
1
@whuber Avez-vous exécuté la simulation dans Mathematica? Pourriez-vous publier du code?
supposé normal
1
@Max Le code est maintenant en place. Je m'excuse pour le manque de commentaires. Si vous exécutez chacune des données de test randomPairset nextsur celles-ci, leurs fonctions devraient devenir apparentes. Notez l'utilisation de NestListpour itérer nextafin de produire plusieurs générations.
whuber
3

Que se passe-t-il lorsque vous essayez de compter les ancêtres?

n2n2528

C'est le bon point de départ, mais il y a quelque chose qui ne va pas dans ce calcul, car la population de la Terre en 1300 ne se mélangeait pas uniformément, et nous ignorons les mariages mixtes au sein de votre "arbre" ancestral, c'est-à-dire que nous comptons deux fois certains ancêtres.

228

vqv
la source
2
Très important étant donné que beaucoup de la population à l'époque était plutôt isolée les uns des autres, il y avait donc beaucoup moins de possibilités d'éviter les mariages mixtes.
dcl
2
Supposons donc que le PO soit d'origine anglaise et vers 1300, la population anglaise était supérieure à un million. (Disons avant la grande famine). Comment cela changerait-il votre analyse?
dassouki
228268
228/34
2

Plus vous reculez, plus vous êtes susceptible d'être lié à une personne qui a transmis avec succès ses gènes qui vivaient à cette époque. Sur les 1/4 milliards d'ancêtres que vous avez qui ont vécu en 1300, beaucoup d'entre eux apparaîtront des centaines (sinon des milliers, des millions) de fois dans votre arbre généalogique. La dérive génétique et le nombre de fois où nous sommes directement liés à quelqu'un sont probablement plus pertinents pour les différences de notre code génétique que qui étaient nos ancêtres.

Tim
la source
0

La probabilité est = 1-z, chaque descendant dans ce problème est lié aux ancêtres ci-dessus. Quel que soit le taux de reproduction initial (1-z), c'est votre probabilité de descendre d'une personne de la population initiale. Seule une probabilité incertaine est de savoir quelles sont les chances d'être en vie dans la population finale.

Je suis d'accord avec la réponse d'Erad, bien que je pense maintenant qu'elle répond à une question qui n'a pas été posée - à savoir quelle est la probabilité que vous soyez vivant étant donné certaines contraintes connues de reproduction et de population sur vos ancêtres.

Wipa
la source
n1zzg
De plus, pour clarifier, la question est de trouver la probabilité qu'une personne particulière dans la génération finale descende d' une personne particulière dans la génération initiale.
xpda
1
AAAA
Le cogito de @Wipa Descartes , ergo sum suggère fortement que la probabilité que je sois vivant compte tenu des contraintes sur mes ancêtres est de 100% :-)
whuber
@whuber, vous avez raison. Je pense que nous parlons du même problème. Ce que je voulais clarifier, c'est que je ne recherche pas la probabilité qu'une personne de la première génération ait un descendant vivant dans la dernière génération. J'avais peur que c'est là que Wipa ait trouvé (1-z) pour la réponse.
xpda
0

p>(1z)×1n1(1z)2=2n1

Réponse expliquée:
Étant donné une personne en particulier aujourd'hui, il est certain qu'elle est une descendante d' au moins 2 personnes en 1300.

Lors de la sélection d'une personne en 1300, il y a (1-z) chance que cette personne ne se soit jamais reproduite, et l'autre terme désigne le nombre de `` couples de parents '' et la probabilité que la personne soit liée à ce couple (1 / nombre de couples).

p>2n1


nk+1=nk(1z)×c2=n1(1z)kck2k







p>2/360,000,000=5.56×109

Merci d'avoir lu, Erad

Erad
la source
cz
Basé sur la question originale ci-dessus: c = le nombre moyen d'enfants par couple, et z = le pourcentage de personnes qui n'ont pas d'enfants
Erad
2
1/n1/360M109
3
360,000,000/(2.66×10249)1
1
108
0

C'est une question très intéressante car elle nous demande de résoudre mathématiquement une fractale. Tels que le célèbre jeu de la vie .

p1=2n1limkpk=(1z)

Si nous notons la probabilité qu'une personne de la génération soit liée à la population initiale. Et pour plus de simplicité, détendons la règle des frères et sœurs et cousins ​​(peut être ajoutée plus tard). Ensuite: k p 1 = 2pkk

p1=2n1

Comme chaque personne de la nouvelle génération a exactement 2 ancêtres dans la population initiale. Dans ce cas, les parents peuvent être calculés comme : Ou en d'autres termes, le nombre de combinaisons de frères et sœurs, multiplié par le nombre de familles de frères et sœurs, divisé par le nombre total de combinaisons d'accouplements.

p2=relatives×2n2+non.relatives×4n2
relatives=(c2)×nc(n2)=c1n1
p3=immediate.relatives×4n3+cousins×6n3+non.relatives×8n3

À chaque génération, la probabilité d'être lié à une personne de la population initiale augmentera sans aucun doute, mais à un rythme décroissant. En effet, la probabilité d'attirer des "parents" qui proviennent du même arbre ou d'un arbre similaire augmentera.

Utilisons l'ethnicité comme exemple. Disons que nous savons pertinemment que quelqu'un est 100% caucasien. À la génération 28, il est probablement lié à une partie importante de la population caucasienne en 1300 (comme le montre la simulation @whuber). Disons qu'il se marie avec quelqu'un qui est à 100% d'une origine ethnique différente. Leur progéniture sera liée à environ le double du nombre de personnes auxquelles ils sont liés à partir de 1300.

Une autre pensée intéressante est que, étant donné que la race humaine (homosapien) a commencé avec environ 600 personnes en Afrique, nous sommes très probablement une permutation génétique de tous ceux qui se sont accouplés avec succès.

Erad
la source