Nous lançons un dé à 6 faces un grand nombre de fois.
En calculant la différence (valeur absolue) entre un rouleau et son rouleau précédent, les différences devraient-elles être uniformément réparties?
Pour illustrer avec 10 rouleaux:
roll num result diff
1 1 0
2 2 1
3 1 1
4 3 2
5 3 0
6 5 2
7 1 4
8 6 5
9 4 2
10 4 0
Les diff
valeurs seraient-elles réparties uniformément?
distributions
uniform
Hé Jude
la source
la source
Réponses:
Non ce n'est pas uniforme
Vous pouvez compter les possibilités également probables pour les différences absolues36
qui donne une distribution de probabilité pour les différences absolues de
la source
En utilisant uniquement les axiomes les plus élémentaires sur les probabilités et les nombres réels, on peut prouver une affirmation beaucoup plus forte:
(Une déclaration analogue pour les variables continues est prouvée au format PDF uniforme de la différence de deux RV .)
L'idée est que la chance queX−Y soit une valeur extrême doit être inférieure à la chance que X−Y soit zéro, car il n'y a qu'une seule façon de (par exemple) maximiser X−Y alors qu'il existe de nombreuses façons de faire la différence zéro , car et ont la même distribution et peuvent donc être égaux. Voici les détails.X Y
Observons d' abord que les deux variables hypothétiques et en question ne peuvent chacune atteindre qu'un nombre fini de valeurs avec une probabilité positive, car il y aura au moins différences distinctes et une distribution uniforme leur attribue toutes une probabilité égale. Si est infini, il en sera de même du nombre de différences possibles ayant une probabilité positive et égale, d'où la somme de leurs chances serait infinie, ce qui est impossible.X Y n n n
Ensuite , comme le nombre de différences est fini, il y en aura une plus grande. La plus grande différence ne peut être obtenue qu'en soustrayant la plus petite valeur de - l'appel delet it et en supposant qu'il a une probabilité --de la plus grande valeur de --l'appel delet que celui-là avec Parce que et sont indépendants, la chance de cette différence est le produit de ces chances,Y m q=Pr(Y=m) X M p=Pr(X=M). X Y
Enfin , parce que et ont la même distribution, il existe de nombreuses façons dont leurs différences peuvent produire la valeur Parmi ces façons, il y a les cas où et Parce que cette distribution n'est pas constante, diffère de Cela montre que ces deux cas sont des événements disjoints et qu'ils doivent donc contribuer au moins un montant à la chance que est zéro; C'est,X Y 0. X=Y=m X=Y=M. m M. p 2 + q 2 X - Yp2+q2 X−Y
Puisque les carrés des nombres ne sont pas négatifs, où nous déduisons de que0≤(p−q)2, (∗)
montrant la distribution de n'est pas uniforme, QED.X−Y
Modifier en réponse à un commentaire
Une analyse similaire des différences absoluesobserve que parce que et ont la même distribution,Cela nous oblige à étudierLa même technique algébrique donne presque le même résultat, mais il est possible que etCe système d'équations a la solution unique|X−Y| X Y m=−M. Pr(X−Y=|M−m|)=2pq. 2pq=2pq+(p−q)2 2pq+p2+q2=1. p=q=1/2 correspondant à une pièce de monnaie équitable (un "dé à deux faces"). Hormis cette exception, le résultat des différences absolues est le même que celui des différences, et pour les mêmes raisons sous-jacentes déjà données: à savoir, les différences absolues de deux variables aléatoires iid ne peuvent pas être uniformément réparties lorsqu'il y a plus de deux différences distinctes avec une probabilité positive.
(fin du montage)
Appliquons ce résultat à la question, qui pose une question un peu plus complexe.
Modélisez chaque lancer indépendant du dé (qui pourrait être un dé injuste ) avec une variable aléatoire Les différences observées dans ces rouleaux sont les nombres On peut se demander à quel point ces nombres sont uniformément répartis . C'est vraiment une question sur les attentes statistiques: quel est le nombre attendu de égal à zéro, par exemple? Quel est le nombre attendu de égal à ? Etc.Xi, i=1,2,…,n. n ΔXi=Xi+1−Xi. n−1 ΔXi ΔXi −1
L'aspect problématique de cette question est que les ne sont pas indépendants: par exemple, et impliquent le même roulementΔXi Δ X 1 = X 2 - X 1 Δ X 2 = X 3 - X 2 X 2 .ΔX1=X2−X1 ΔX2=X3−X2 X2.
Cependant, ce n'est pas vraiment une difficulté. Étant donné que l'attente statistique est additive et que toutes les différences ont la même distribution, si nous choisissons une valeur possible des différences, le nombre attendu de fois que la différence est égale à dans toute la séquence de rouleaux est juste fois le nombre attendu de fois la différence est égale à en une seule étape du processus. Cette attente en une seule étape est (pour tout ). Ces attentes seront les mêmes pour tous les (c'est-à-dire uniformes ) si et seulement si elles sont les mêmes pour un seulk k n n−1 k Pr(ΔXi=k) i k ΔXi. Mais nous avons vu qu'aucun n'a une distribution uniforme, même lorsque le dé peut être biaisé. Ainsi, même dans ce sens plus faible des fréquences attendues, les différences des rouleaux ne sont pas uniformes.ΔXi
la source
À un niveau intuitif, un événement aléatoire ne peut être uniformément distribué que si tous ses résultats sont également probables.
En est-il de même pour l'événement aléatoire en question - différence absolue entre deux lancers de dés?
Il suffit dans ce cas de regarder les extrêmes - quelles sont les valeurs les plus grandes et les plus petites que cette différence pourrait prendre?
Évidemment, 0 est le plus petit (nous examinons les différences absolues et les rouleaux peuvent être les mêmes), et 5 est le plus grand (
6
vs1
).Nous pouvons montrer que l'événement n'est pas uniforme en montrant qu'il
0
est plus (ou moins) susceptible de se produire que5
.En un coup d'œil, il n'y a que deux façons pour que 5 se produise - si le premier dé est 6 et le second 1, ou vice versa . De combien de façons 0 peut-il se produire?
la source
Comme l'a présenté Henry, les différences de distributions uniformément distribuées ne sont pas uniformément distribuées.
Pour illustrer cela avec des données simulées, nous pouvons utiliser un script R très simple:
On voit que cela produit en effet une distribution uniforme. Voyons maintenant la distribution des différences absolues de deux échantillons aléatoires de cette distribution.
la source
D'autres ont travaillé les calculs, je vais vous donner une réponse qui me semble plus intuitive. Vous voulez étudier la somme de deux unifrom rv (Z = X + (-Y)), la distribution globale est le produit de convolution (discret):
Cette somme est plutôt intuitive: la probabilité d'obtenir , est la somme des probabilités d'obtenir quelque chose avec X (noté ici) et le complément de avec -Y.z k z
Du traitement du signal, nous savons comment se comportent les produits de convolution:
Vous pouvez comprendre ce qui se passe ici: lorsque monte (la ligne pointillée verticale), le domaine commun des deux rectangles monte et descend, ce qui correspond à la probabilité d'obtenir .z z
Plus généralement, nous savons que les seules fonctions stables par convolution sont celles de la famille gaussienne. c'est-à-dire que seule la distribution gaussienne est stable par addition (ou plus généralement, combinaison linéaire). Cela signifie également que vous n'obtenez pas de distribution uniforme lorsque vous combinez des distributions uniformes.
Quant à savoir pourquoi nous obtenons ces résultats, la réponse réside dans la décomposition de Fourrier de ces fonctions. La transformation de Fourrier d'un produit de convolution étant le simple produit des transformations de Fourrier de chaque fonction. Cela donne des liens directs entre les coefficients de Fourrier des fonctions rectangle et triangle.
la source
Si et sont deux lancers de dés consécutifs, vous pouvez visualiser (pour ) comme suit où chaque couleur correspond à une valeur différente de :x y |x−y|=k k=0,1,2,3,4,5 k
Comme vous pouvez facilement le voir, le nombre de points pour chaque couleur n'est pas le même; par conséquent, les différences ne sont pas uniformément réparties.
la source
Soit la différence et la valeur du rouleau, alorsDt X P(Dt=5)=P(Xt=6,Xt−1=1)<P((Xt,Xt−1)∈{(6,3),(5,2)})<P(Dt=3)
La fonction n'est donc pas constante en . Cela signifie que la distribution n'est pas uniforme.P(Dt=d) d
la source