De manière informelle, une distribution de probabilité définit la fréquence relative des résultats d'une variable aléatoire - la valeur attendue peut être considérée comme une moyenne pondérée de ces résultats (pondérée par la fréquence relative). De même, la valeur attendue peut être considérée comme la moyenne arithmétique d'un ensemble de nombres générés exactement proportionnellement à leur probabilité d'occurrence (dans le cas d'une variable aléatoire continue, cela n'est pas tout à fait vrai puisque les valeurs spécifiques ont une probabilité égale à ).0
Le lien entre la valeur attendue et la moyenne arithmétique est le plus clair avec une variable aléatoire discrète, où la valeur attendue est
E( X) = ∑Sx P( X= x )
où est l’espace échantillon. Par exemple, supposons que vous ayez une variable aléatoire discrète X telle que:SX
X= ⎧⎩⎨123avec une probabilité une / huitavec une probabilité 3 / 8avec une probabilité de 1 / 2
P( X= 1 ) = 1 / 8P(X=2)=3/8P(X=3)=1/2
E(X)=1⋅(1/8)+2⋅(3/8)+3⋅(1/2)=2.375
{1,1,2,2,2,2,2,2,3,3,3,3,3,3,3,3}123
1+1+2+2+2+2+2+2+3+3+3+3+3+3+3+316=2.375
et vous pouvez voir que c'est exactement égal à la valeur attendue.
L’attente est la valeur moyenne ou la moyenne d’une variable aléatoire et non d’une distribution de probabilité. En tant que tel, il s’agit pour les variables aléatoires discrètes de la moyenne pondérée des valeurs prises par la variable aléatoire où la pondération est fonction de la fréquence relative d’apparition de ces valeurs individuelles. Pour une variable aléatoire absolument continue, il s'agit de l'intégrale de valeurs x multipliée par la densité de probabilité. Les données observées peuvent être considérées comme les valeurs d'une collection de variables aléatoires indépendantes distribuées de manière identique. La moyenne de l'échantillon (ou les attentes de l'échantillon) est définie comme l'attente des données par rapport à la distribution empirique des données observées. Cela en fait simplement la moyenne arithmétique des données.
la source
Portons une attention particulière aux définitions:
La moyenne est définie comme la somme d'une collection de nombres divisée par le nombre de nombres de la collection. Le calcul serait "pour i en 1 à n, (somme de x sous i) divisé par n."
La valeur attendue (EV) est la valeur moyenne à long terme des répétitions de l'expérience qu'elle représente. Le calcul serait "pour i en 1 à n, somme de l'événement x sous i fois sa probabilité (et la somme de tous les p sous i doit = 1)".
Dans le cas d'un dé juste, il est facile de voir que la moyenne et le VE sont les mêmes. Moyenne - (1 + 2 + 3 + 4 + 5 + 6) / 6 - 3,5 et EV seraient:
prob xp * x
0,167 1 0,17
0,167 2 0,33
0,167 3 0,50
0,167 4 0,67
0,167 5 0,83
0,167 6 1,00
EV = somme (p * x) = 3,50
Mais que se passe-t-il si les dés n'étaient pas "justes"? Un moyen facile de créer un dé injuste serait de percer un trou dans le coin, à l'intersection des 4, 5 et 6 faces. De plus, disons maintenant que la probabilité de lancer un 4, 5 ou 6 sur notre nouveau dé tordu amélioré est maintenant de 0,2 et que la probabilité de lancer un 1, 2 ou 3 est maintenant de 0,133. C'est le même dé avec 6 faces, un chiffre sur chaque face et la moyenne pour cette dé est toujours de 3,5. Cependant, après avoir lancé ce dé plusieurs fois, notre VE est maintenant de 3,8 car les probabilités pour les événements ne sont plus les mêmes pour tous les événements.
prob xp * x
0,133 1 0,13
0,133 2 0,27
0,133 3 0,40
0,200 4 0,80
0,200 5 1,00
0,200 6 1,20
EV = somme (p * x) = 3,80
Encore une fois, soyons prudents et revenons à la définition avant de conclure qu'une chose sera toujours "la même" qu'une autre. Jetez un coup d'œil à la configuration d'un dé normal, percez un trou dans les 7 autres coins et voyez comment les VE changent - amusez-vous.
Bob_T
la source
La seule différence entre "moyenne" et "valeur attendue" est que la moyenne est principalement utilisée pour la distribution de fréquence et que l'attente est utilisée pour la distribution de probabilité. Dans la distribution de fréquence, l’espace échantillon est constitué de variables et de leurs fréquences d’occurrence. Dans la distribution de probabilité, l'espace échantillon est constitué de variables aléatoires et de leurs probabilités. Nous savons maintenant que la probabilité totale de toutes les variables dans l'espace échantillon doit être = 1. Ici réside la différence fondamentale. Le terme dénominateur pour l'attente est toujours = 1. (c'est-à-dire somme f (xi) = 1) Cependant, aucune restriction de ce type sur la somme des fréquences (qui est fondamentalement le nombre total d'entrées).
la source