Quel est le nom de l'erreur statistique selon laquelle les résultats des tours de pièces précédents influencent les croyances au sujet des tours de pièces suivants?

28

Comme nous le savons tous, si vous lancez une pièce de monnaie qui a autant de chances d'atterrir des têtes que de la queue, alors si vous lancez la pièce plusieurs fois, la moitié du temps, vous obtiendrez des têtes et la moitié du temps, vous obtiendrez des queues.

En discutant avec un ami, ils ont dit que si vous jetiez la pièce 1000 fois, et disons les 100 premières fois qu'elle atterrissait, les chances d'atterrir une queue étaient augmentées (la logique étant que si elle est impartiale, puis au moment où vous l'avez retourné 1000 fois, vous aurez environ 500 têtes et 500 queues, donc les queues doivent être plus probables).

Je sais que c'est une erreur, car les résultats passés n'influencent pas les résultats futurs. Y a-t-il un nom pour cette erreur particulière? De plus, y a-t-il une meilleure explication de la raison pour laquelle cela est fallacieux?

oggmonster
la source
8
Si vous lancez une pièce 100 fois et qu'elle atterrit 100 fois, il y a de fortes chances que ce ne soit pas une pièce impartiale.
Robert
1
@Robert Comment ça? Étant donné que chaque flip est indépendant de l'autre, la chance qu'il s'agisse de H 100x est la même que s'il s'agissait d'une séquence de H&T incompatible, ou 100x T
yuritsuki
11
@thinlyveiledquestionmark J'aimerais jouer au poker avec vous ... mais seulement si j'ai le droit de traiter. Je pense que Robert veut dire que la réalisation de 100 H sur 100 essais ferait passer sa croyance de la pièce équitable à la pièce injuste. Compte tenu de ces données 100 H sur 100 essais, il faudrait posséder un a priori très fort sur pour ne pas déplacer sensiblement le postérieur. Pr(H)
Sycorax dit Réintégrer Monica le
5
@thinlyveiledquestionmark Vous devez être prudent. Compte tenu des flips indépendants, chaque séquence de 100 flips de H ou T est également probable: 100H est aussi probable que 50H 50T, est aussi probable que HTHTHTHT ... HT, et ainsi de suite. Mais il est beaucoup moins probable d'obtenir 100H que d'obtenir un total de 50 têtes, car il existe 1029 façons différentes de faire monter 50 flips en tête et 50 flips en queue.
Lagerbaer
3
L'idée de Robert est parfaitement valable et peut être la source de "l'erreur" en premier lieu. Nos cerveaux sont câblés dans le sens bayésien et non fréquentiste. Les informations "parfaites" telles que la "pièce absolument juste" existent rarement dans la nature. Ainsi, 100 têtes sur 100 essais nous feront pratiquement croire queP(Heads)>0.5
PA6OTA

Réponses:

32

La première phrase de cette question, incorpore une autre erreur (connexe):

"Comme nous le savons tous, si vous lancez une pièce qui a une chance égale de faire atterrir des têtes comme elle le fait avec des queues, alors si vous lancez la pièce plusieurs fois, la moitié du temps vous obtiendrez des têtes et la moitié du temps vous obtiendrez des queues ."

Non, nous n'obtiendrons pas cela, nous n'aurons pas les têtes la moitié du temps et les queues la moitié du temps. Si nous devions l'obtenir, le joueur ne se tromperait pas autant après tout . L'expression mathématique de cette déclaration verbale est la suivante: pour certains "grands" (mais finis) , nous avons , où évidemment dénote le nombre de fois la pièce atterrit. Puisque est fini, alors est également fini et une valeur distincte de . Alors, que se passe-t-il après que le flip a été effectué? Soit il a atterri, soit non. Dans les deux cas,n h = n n nhnn+1nn+1nhnh=n2nhnn+1nn+1nh vient de cesser d'être égal à "la moitié du nombre de lancers".

Mais peut-être que ce que nous voulions vraiment dire était un "incroyablement grand" ? Ensuite, nous déclaronsn

limnnh=n2

Mais ici, le RHS ("côté droit") contient qui par le LHS ("côté gauche"), est passé à l'infini. Donc, le RHS est aussi l'infini, et donc ce que dit cette déclaration est que le nombre de fois où la pièce atterrira est égal à l'infini, si nous jetons la pièce un nombre infini de fois (la division par est négligeable):2n2

limnnh=n2=

C'est une déclaration essentiellement correcte, mais inutile , et évidemment pas ce que nous avons à l'esprit.

En tout, l'énoncé de la question ne tient pas, que le «lancer total» soit considéré comme fini ou non.

Peut-être alors devrions-nous dire

limnnhn=12?

Tout d'abord, cela se traduit par "Le rapport du nombre de têtes débarquées sur le nombre total de lancers tend vers la valeur lorsque le nombre de lancers tend vers l'infini", ce qui est une déclaration différente - pas de "la moitié du total des lancers" ici. C'est aussi ainsi que la probabilité est encore parfois perçue - comme une limite déterministe des fréquences relatives. Le problème avec cette affirmation est qu'elle contient dans le LHS une forme indéterminée: le numérateur et le dénominateur vont à l'infini. 1/2

Hmmm, apportons l' arsenal variable aléatoire . Définissez une variable aléatoire comme prenant la valeur si le ème lancer est venu en tête, s'il est venu en queue. Nous avons alors 1 i 0 n hXi1i0

nhn=1ni=1nXi

Pouvons-nous maintenant dire au moins

limn1ni=1nXi=12?

Non . Il s'agit d'une limite déterministe. Il permet toutes les réalisations possibles de la séquence des , et donc il ne garantit même pas qu'une limite existera, encore moins qu'elle soit égale à . En fait, une telle déclaration ne peut être considérée que comme une contrainte sur la séquence, et elle détruirait l'indépendance des lancers.une / deuxX1/2

Ce que l'on peut dire, c'est que cette somme moyenne converge en probabilité ("faiblement") vers (Bernoulli - Loi faible des grands nombres),1/2

limnPr(|1ni=1nXi12|<ε)=1,ε>0

et dans le cas considéré, qu'il converge également presque sûrement ("fortement") (Borel - Loi forte des grands nombres)

Pr(limn1ni=1nXi=12)=1,

Mais ce sont des déclarations probabilistes sur la probabilité associée à la différence entre et , et non sur la limite de la différence (qui, selon la fausse déclaration, devrait être nulle - et ce n'est pas le cas). une / 2 n h - n tnh/n1/2nhnt

Certes, il faut un effort intellectuel dévoué pour vraiment comprendre ces deux déclarations, et comment elles diffèrent (en "théorie" et en "pratique") de certaines des précédentes - je ne revendique pas pour l'instant une compréhension aussi profonde.

Alecos Papadopoulos
la source
1
Peut-être l'une des meilleures réponses éducatives que j'ai lues depuis longtemps. Bien joué.
Pete Mancini
@AlecosPapadopoulos Je pense que cela aiderait la réponse à mettre la chose que nous pouvons dire dans une formule comme vous l'avez fait avec les fausses formulations. Je suppose que c'est quelque chose comme \ lim P (\ frac {1} {n} \ sum X_i) = 1?
kutschkem
@kutschkem Excellente suggestion. Juste fait.
Alecos Papadopoulos
12

Cette erreur a plusieurs noms.

1) Il est probablement mieux connu sous le nom de sophisme du joueur

2) on l'appelle aussi parfois la `` loi des petits nombres '' (voir aussi ici ) (car elle se rapporte à l'idée que les caractéristiques de la population doivent se refléter dans de petits échantillons) - ce qui, je pense, est un nom soigné pour son contraste avec la loi de grands nombres, mais malheureusement le même nom est appliqué à la distribution de Poisson (et aussi parfois utilisé par les mathématiciens pour signifier autre chose), ce qui peut être déroutant.

3) chez les personnes qui croient à l'erreur, on l'appelle parfois la `` loi des moyennes '', qui en particulier a tendance à être invoquée après une course sans résultat pour affirmer que le résultat est `` dû '', mais bien sûr, pas à court terme il existe une loi - rien n'agit pour «compenser» un déséquilibre initial - la seule façon d'éliminer un écart initial est le volume de valeurs ultérieures qui elles-mêmes ont une moyenne de 1/2 .

HiTiii=Hi+Ti

n 1Hnn E| Hn-Tn| n12E|HnTn|n

Glen_b -Reinstate Monica
la source
1

Pensez-vous à «stochastique»? Le lancer d'une pièce juste (ou le lancer d'un dé équitable) est stochastique (c'est-à-dire indépendant) dans le sens où il ne dépend pas d'un coup précédent de cette pièce. En supposant une bonne con, le fait que la pièce ait été retournée cent fois avec une centaine de têtes en résultant ne change pas le fait que le prochain lancer a 50/50 de chances d'être des têtes.

En revanche, la probabilité de tirer une certaine carte de tirer une carte d'un jeu de cartes sans remplacement n'est pas stochastique car la probabilité de tirer une certaine carte changera la probabilité de tirer la carte lors du prochain tirage (si c'était avec remplacement, ce serait stochastique).

user63551
la source
stochastique ne signifie pas indépendant
Ben Voigt
1
"En supposant une bonne con ... le prochain flip a 50/50 de chances d'être des têtes" , je pense que vous avez une profonde vérité philosophique ici. Vous pouvez développer la réponse pour expliquer ce qui se passe si c'est un con injuste (AKA régulier?).
hyde
0

XnnXnN(n/2,n/4)X1000

P(469<X1000<531).95

X100=100Y900

P(469<X1000<531X100=100)=P(369<Y900<431).1

Y900N(450,15)

Ainsi, après avoir observé 100 têtes dans les 100 premiers essais, il n'y a plus de forte probabilité d'observer près de 500 succès dans les 1000 premiers essais, en supposant bien sûr que la pièce est juste. Il convient de noter qu'il s'agit d'un exemple concret illustrant qu'il est peu probable qu'un déséquilibre initial soit compensé à court terme.

n=1,000,000

P(499,020<X1,000,000<500,980).95

mais l'impact du déséquilibre dans les 100 premiers lancers est négligeable à long terme depuis

P(499,020<X1,000,000<500,980X100=100)=P(498,920<Y999,900<500880).949

jsk
la source
0

Vous faites référence à l'erreur de Gambler , bien que ce ne soit pas tout à fait correct.

En effet, si on l'exprime comme "étant donné une pièce équitable supposée et que l'on observe une séquence donnée de résultats, quelle est l'estimation des probabilités élémentaires de la pièce", cela devient plus apparent.

En effet, le " sophisme " n'est lié qu'aux pièces de monnaie équitables (supposées), où les différents produits des prob sont égaux. Cependant, cela implique une interprétation qui contraste avec (l'étude de) cas similaires avec une pièce ayant une autre distribution de probabilité (non symétrique / biaisée).

Pour une discussion plus approfondie de ceci (et un petit tour) voir cette question .

C'est exactement comme l' erreur utilisée dans de nombreuses études statistiques où la corrélation implique la causalité . Mais cela peut être un indice d'une relation de causalité ou d'une cause commune.

Nikos M.
la source