Nous avons donc la moyenne arithmétique (AM), la moyenne géométrique (GM) et la moyenne harmonique (HM). Leur formulation mathématique est également bien connue, ainsi que leurs exemples stéréotypés associés (par exemple, la moyenne harmonique et son application aux problèmes liés à la «rapidité»).
Cependant, une question qui m’a toujours intriguée est la suivante: "Comment puis-je choisir le moyen le plus approprié dans un contexte donné?" Il doit y avoir au moins une règle de base pour aider à comprendre l'applicabilité et pourtant la réponse la plus courante que j'ai rencontrée est: "Cela dépend" (mais sur quoi?).
Cela peut sembler être une question plutôt triviale, mais même les textes des lycées ne l'ont pas expliqué - ils ne fournissent que des définitions mathématiques!
Je préfère une explication anglaise à une explication mathématique - un simple test serait: "est-ce que votre mère / votre enfant le comprendrait?"
Réponses:
Cette réponse peut être légèrement plus mathématique que ce que vous recherchiez.
La chose importante à reconnaître est que tous ces moyens sont simplement le moyen arithmétique déguisé .
La caractéristique importante pour identifier lequel (le cas échéant) des trois moyens communs (arithmétique, géométrique ou harmonique) est le moyen "correct" consiste à trouver la "structure additive" dans la question à traiter.
En d'autres termes, supposons que nous recevions des quantités abstraites , que j'appellerai "mesures", abusant quelque peu de ce terme ci-dessous pour des raisons de cohérence. Chacune de ces trois moyennes peut être obtenue en (1) transformant chaque en une certaine , (2) en prenant la moyenne arithmétique , puis (3) en revenant à l’échelle de mesure initiale.x i y ix1,x2,…,xn xi yi
Moyenne arithmétique : Nous utilisons évidemment la transformation "identité": . Ainsi, les étapes (1) et (3) sont triviales (rien n’est fait) et .ˉ x A M = ˉ yyi=xi x¯AM=y¯
Moyenne géométrique : Ici, la structure additive est sur les logarithmes des observations originales. Donc, on prend et ensuite pour obtenir le GM à l'étape (3), on convertit via la fonction inverse du , c'est-à-dire, . connecte ˉ x G M = exp ( ˉ y )yi=logxi log x¯GM=exp(y¯)
Moyenne harmonique : Ici, la structure additive est sur les inverses de nos observations. Donc, , d’où .ˉ x H M = 1 / ˉ yyi=1/xi x¯HM=1/y¯
Dans les problèmes physiques, cela survient souvent par le processus suivant: Nous avons une quantité qui reste fixe par rapport à nos mesures et quelques autres quantités, disons . Maintenant, nous jouons au jeu suivant: Gardons et constants et essayons de trouver des tels que si nous remplaçons chacune de nos observations individuelles par , la relation "totale" est toujours conservée .x 1 , ... , x n z 1 , ... , z n w z 1 + ⋯ + z n ˉ x x i ˉ xw x1,…,xn z1,…,zn w z1+⋯+zn x¯ xi x¯
L'exemple distance – vélocité – temps semble être populaire, alors utilisons-le.
Distance constante, temps variables
Considérons une distance fixe parcourue . Supposons maintenant que nous parcourons cette distance fois à des vitesses différentes à la vitesse , en prenant les temps . Nous jouons maintenant à notre jeu. Supposons que nous voulions remplacer nos vitesses individuelles par une vitesse fixe telle que le temps total reste constant. Notez que nous avons sorte que . Nous voulons que cette relation totale (temps total et distance totale parcourue) soit conservée lorsque nous remplaçons chacun des par dans notre jeu. Par conséquent, n v 1 , … , v n t 1 , … , t n ˉ v d - v i t i = 0d n v1,…,vn t1,…,tn v¯
Notez que la "structure additive" ici est relative aux temps individuels, et que nos mesures leur sont inversement liées, par conséquent la moyenne harmonique s’applique.
Distances variables, temps constant
Maintenant, changeons la situation. Supposons que, pour instances, nous parcourions un temps fixe vitesses sur des distances . Maintenant, nous voulons que la distance totale soit conservée. Nous avons et le système total est conservé si . Pour reprendre notre jeu, nous cherchons un tel que mais puisque , nous obtenons quen t v1,…,vn d1,…,dn
Ici, la structure additive que nous essayons de maintenir est proportionnelle à nos mesures. La moyenne arithmétique s’applique.
Cube de volume égal
Supposons que nous ayons construit une boîte à dimensions avec un volume donné et que nous mesurions les longueurs latérales de la boîte. Ensuite, et supposons que nous voulions construire un (hyper) cube de dimension avec le même volume. En d’autres termes, nous souhaitons remplacer nos longueurs latérales individuelles par une longueur latérale commune . Alorsn V
Cela indique facilement que nous devrions prendre .x¯=(xi⋯xn)1/n=x¯GM
Notez que la structure additive se trouve dans les logarithmes, c’est-à-dire et nous essayons de conserver la quantité de gauche.logV=∑ilogxi
Nouveau moyen de vieux
En tant qu'exercice, réfléchissez à ce que signifie "naturel" dans la situation où vous laissez les distances et les temps varier dans le premier exemple. C'est-à-dire que nous avons des distances , des vitesses et des temps . Nous voulons conserver la distance totale et le temps total parcouru et trouver une constante pour y parvenir.v i t i ˉ vdi vi ti v¯
Exercice : quelle est la signification "naturelle" de cette situation?
la source
En développant l'excellent commentaire de @Brandon (qui, selon moi, mérite d'être encouragé pour répondre):
La moyenne géométrique doit être utilisée lorsque vous vous intéressez aux différences multiplicatives. Brandon note que la moyenne géométrique devrait être utilisée lorsque les plages sont différentes. Ceci est généralement correct. La raison en est que nous voulons égaliser les gammes. Par exemple, supposons que les candidats à l’université soient notés sur la note SAT (0 à 800), la moyenne cumulative dans le SH (0 à 4) et les activités parascolaires (1 à 10). Si un collège souhaitait faire la moyenne de ces valeurs et égaliser les fourchettes (c'est-à-dire que le poids augmente dans chaque qualité par rapport à la fourchette), la moyenne géométrique serait la solution.
Mais ce n'est pas toujours vrai lorsque nous avons des échelles avec des gammes différentes. Si nous comparions le revenu dans différents pays (y compris les pays pauvres et les pays riches), nous ne voudrions probablement pas la moyenne géométrique, mais la moyenne arithmétique (ou, plus probablement, la médiane ou peut-être une moyenne ajustée).
La seule utilisation que je connaisse de la moyenne harmonique est celle de la comparaison des taux. Par exemple, si vous conduisez de New York à Boston à 40 km / h et que vous revenez à 60 km / h, votre moyenne générale n'est pas la moyenne arithmétique de 50 mi / h, mais la moyenne harmonique.
AM = HM =2 / ( 1 / 40 + 1 / 60 ) = 48(40+60)/2=50 2/(1/40+1/60)=48
pour vérifier que cela convient à cet exemple simple, imaginons qu’il s’agit de 120 miles entre New York et Boston. Ensuite, le trajet dure 3 heures, le trajet de retour dure 2 heures, le total est de 5 heures et la distance est de 240 miles.240/5=48
la source
Je vais essayer de résumer à 3-4 règles empiriques et de donner quelques exemples supplémentaires des moyens pythagoriciens.
La relation entre les 3 moyennes est HM <GM <AM pour les données non négatives avec certaines variations . Ils seront égaux si et seulement s'il n'y a aucune variation des données d'échantillon.
Pour les données en niveaux, utilisez le AM. Les prix sont un bon exemple. Pour les ratios, utilisez le GM. Les rendements des investissements, les prix relatifs tels que l'indice Bloomberg Billy (le prix de la bibliothèque Billy d'Ikea dans différents pays par rapport au prix américain) et l'indice de développement humain des Nations Unies en sont tous des exemples. HM est approprié lorsqu'il s'agit de taux. Voici un exemple non-automobile de David Giles :
David discute également de la version pondérée des 3 moyennes, qui apparaissent dans les indices de prix utilisés pour mesurer l'inflation.
Un détournement à part:
Ces ROT ne sont pas parfaits. Par exemple, j'ai souvent du mal à comprendre si quelque chose est un taux ou un ratio. Les rendements d'un investissement sont généralement traités comme un ratio lors du calcul de la moyenne, mais ils constituent également un taux, car ils sont généralement libellés en "x% par unité de temps". Est-ce que "utiliser HM lorsque les données sont en niveaux par unité de temps" serait une meilleure heuristique?
Si vous vouliez résumer l’ indice Big Mac des pays d’Europe du Nord, utiliseriez-vous le GM?
la source
Une réponse possible à votre question ("comment décider de la moyenne la plus appropriée dans un contexte donné?") Est la définition de la moyenne donnée par le mathématicien italien Oscar Chisini .
Voici un article avec une explication plus détaillée et quelques exemples (vitesse moyenne et autres).
la source
Je pense qu'un moyen simple de répondre à la question serait:
Moyenne harmonique = 2ab / (a + b) = a (b / a + b) + b (a / (a + b)
Par exemple: la moyenne des coûts en dollars entre dans cette catégorie car le montant que vous investissez (A) reste fixe, mais le prix par action (P) et le nombre d'actions (N) varient (A = PN). En fait, si vous pensez à une moyenne arithmétique comme un nombre également centré entre deux nombres, la moyenne harmonique est également un nombre également centré entre deux nombres mais (et c'est bien beau) le "centre" est l'endroit où les pourcentages (ratios) sont égal. C'est-à-dire: (x - a) / a = (b -x) / b, où x est la moyenne harmonique.
la source
$x$
produit . Pour les fractions noter que produit . Consultez notre aide à l'édition pour plus d'informations. a\frac{a}{b}