Comment la valeur attendue est-elle liée à la moyenne, la médiane, etc. dans une distribution non normale?

9

Comment la valeur attendue d'une variable aléatoire continue est-elle liée à sa moyenne arithmétique, sa médiane, etc. dans une distribution non normale (par exemple, skew-normal)? Je suis intéressé par toutes les distributions communes / intéressantes (par exemple, les distributions log-normales, simples bi / multimodales, tout ce qui est bizarre et merveilleux).

Je recherche principalement des réponses qualitatives, mais toutes les réponses quantitatives ou formelles sont également les bienvenues. J'aimerais particulièrement voir des représentations visuelles qui le rendent plus clair.

rien101
la source
Pouvez-vous être un peu plus clair? La moyenne arithmétique et la médiane sont des fonctions que nous appliquons aux données, pas quelque chose d'intrinsèque à des distributions particulières ... par exemple, les données n'ont pas besoin d'être normales pour que vous puissiez calculer la moyenne de l'échantillon.
invité le
Ok, donc la question devrait être techniquement "comment la valeur attendue est-elle liée à la moyenne, la médiane, etc. des données tirées au hasard d'une distribution de probabilité particulière?" Je recherche des interprétations simples et intuitives, similaires à la façon dont vous pouvez intuitivement dire que lorsqu'une distribution est plus asymétrique, la médiane et la moyenne sont plus éloignées, et la médiane peut donner une meilleure indication de l'endroit où se trouvent les données.
naught101
Il h. Merci Marco. J'ai clairement mal lu les choses. Autant écrire cela comme réponse, je la choisirai comme meilleure réponse.
naught101

Réponses:

8

(partiellement converti à partir de mon commentaire maintenant supprimé ci-dessus)

La valeur attendue et la moyenne arithmétique sont exactement la même chose. La médiane est liée à la moyenne de manière non triviale, mais vous pouvez dire quelques choses sur leur relation:

  • quand une distribution est symétrique, la moyenne et la médiane sont les mêmes

  • lorsqu'une distribution est biaisée négativement, la médiane est généralement supérieure à la moyenne

  • lorsqu'une distribution est faussée positivement, la médiane est généralement inférieure à la moyenne

Macro
la source
Intéressant. Quels exemples existe-t-il du comportement inhabituel d'une distribution asymétrique où la moyenne est supérieure à la médiane?
naught101
@ naught101: est-ce une faute de frappe? Une distribution négativement asymétrique est une distribution dans laquelle les résultats de gauche de centre se produisent plus fréquemment que les résultats de droite de centre, et donc la "queue" des résultats de basse fréquence sort vers la droite. Dans une telle situation, la bosse à gauche tirera toujours la moyenne (arithmétique) à gauche du centre, tandis que la queue à droite gardera la médiane supérieure à la moyenne.
Assad Ebrahim
@AssadEbrahim: Non, c'était une référence au commentaire de Macro "la médiane est généralement supérieure à la moyenne" - je demandais des contre-exemples.
naught101
@ naught101: Les contre-exemples dans le cas d'une distribution unimodale sont sa ligne suivante: lorsque la bosse est à droite, la queue à gauche tire la médiane en dessous de la moyenne. Plus la queue est longue, plus l'écart entre la médiane et la moyenne est important.
Assad Ebrahim
1
Quelles sont les circonstances pratiques dans lesquelles on utiliserait une médiane sur une moyenne ou vice versa? Par exemple, dans l'analyse de survie où les durées de vie suivent une distribution exponentielle, dois-je utiliser la médiane (donc la moitié des choses durent plus longtemps, la moitié durent moins) ou la moyenne (la durée de vie "attendue") si je devais prédire la vie / la mort comme un binaire résultat?
drevicko
5

Il existe une belle relation entre l'harmonique, la géométrie et la moyenne arithmétique d'une variable aléatoire log-normalement distribuée . LaisserXLN(μ,σ2)

  • HM(X)=eμ12σ2 (moyenne harmonique),
  • GM(X)=eμ (moyenne géométrique),
  • AM(X)=eμ+12σ2 (moyenne arithmétique).

Il n'est pas difficile de voir que le produit de la moyenne harmonique et arithmétique donne le carré de la moyenne géométrique, c'est-à-dire

HM(X)AM(X)=GM2(X).

Puisque toutes les valeurs sont positives, nous pouvons prendre la racine carrée et trouver que la moyenne géométrique de est la moyenne géométrique de la moyenne harmonique de et la moyenne arithmétique deX XXXX , c'est-à-dire

GM(X)=HM(X)AM(X).

De plus, l'inégalité bien connue HM-GM-AM

HM(X)GM(X)AM(X)

peut être exprimé comme

HM(X)GVar(X)=GM(X)=AM(X)GVar(X),

où est la variance géométrique.GVar(X)=eσ2

Björn Friedrich
la source
1

Par souci d'exhaustivité, il existe également des distributions pour lesquelles la moyenne n'est pas bien définie. Un exemple classique est la distribution de Cauchy ( cette réponse explique pourquoi). Un autre exemple important est la distribution de Pareto avec un exposant inférieur à 2.

drevicko
la source
1
Plusieurs iff. Une loi de puissance n'est pas une distribution, mais une distribution de Pareto est une loi de puissance. Cela concerne la non intégrabilité d'une fonction de puissance log-convexe à . Pour une loi de puissance, vous voulez dire moins de 2, pas plus de 2.x=0
Carl
@Carl bons points - J'ai modifié la réponse en conséquence. Beaucoup de thx (:
drevicko
0

Bien qu'il soit correct que la moyenne mathématique et la valeur d'attente soient définies de manière identique, pour une distribution asymétrique, cette convention de dénomination devient trompeuse.

Imaginez que vous demandez à un ami les prix des logements dans sa ville parce que vous l'aimez vraiment là-bas et pensez réellement à déménager dans cette ville.

Si la distribution des prix du logement était unimodale et symétrique, alors votre ami peut vous dire le prix moyen des maisons et vous pouvez en effet vous attendre à trouver la plupart des maisons sur le marché autour de cette valeur moyenne .

Cependant, si la distribution des prix des logements est unimodale et asymétrique, par exemple asymétrique à droite avec la plupart des maisons dans la fourchette de prix inférieure à gauche et seulement quelques maisons exorbitantes à droite, alors la moyenne sera "asymétrique" à des prix élevés sur la droite.

Pour cette distribution unimodale et asymétrique du prix des maisons, vous pouvez vous attendre à trouver la plupart des maisons sur le marché autour de la médiane .

Sol Hator
la source
1
On ne sait pas exactement ce que vous voulez dire lorsque vous dites pour les distributions unimodales asymétriques que la distribution des prix des logements a des prix autour de la médiane. Ce qui peut être dit, c'est que la moitié des valeurs sera égale ou inférieure à la médiane et la moitié sera égale ou supérieure à la médiane. Il n'indique pas à quel point ces valeurs sont proches de la moyenne.
Michael R. Chernick
Je suppose que votre dernière phrase est censée se terminer par "médiane"? Dans l'affirmative, je pense qu'il est évident que la médiane doit être la valeur (atteignable) la plus proche de la moyenne (qui pourrait ne pas être atteignable, par exemple pas un prix du logement) d'un échantillon aléatoire prélevé dans la population décrite ci-dessus. C'est la médiane la plus proche de cet échantillon moyen, en moyenne. Si ce n'est pas le cas, je n'ai pas prétendu à quel point ces valeurs sont proches de la moyenne. J'ai revendiqué leur distance par rapport à la médiane.
Sol Hator