Y a-t-il quelque chose d'important dans une moyenne géométrique et une moyenne arithmétique qui se rapprochent très près, disons ~ 0,1%? Quelles conjectures peut-on faire sur un tel ensemble de données?
J'ai travaillé sur l'analyse d'un ensemble de données et je remarque que, ironiquement, les valeurs sont très, très proches. Pas exact, mais proche. En outre, une vérification rapide de la justesse de l'inégalité moyenne arithmétique moyenne-géométrique ainsi qu'un examen de l'acquisition des données révèlent qu'il n'y a rien de compliqué à l'intégrité de mon ensemble de données en termes de comment j'ai trouvé les valeurs.
descriptive-statistics
mean
geometric-mean
user12289
la source
la source
x=c(-5,-5,1,2,3,10); prod(x)^(1/length(x))
[1] 3.383363
Réponses:
La moyenne arithmétique est liée à la moyenne géométrique par le biais de l'inégalité Arithmetic-Mean-Geometric-Mean (AMGM) qui stipule que:
où l'égalité est atteinte ssi . Donc, vos points de données sont probablement très proches les uns des autres.X1= x2= ⋯ = xn
la source
En élaborant sur la réponse de @Alex R, une façon de voir l'inégalité AMGM est comme un effet d'inégalité de Jensen. Par l'inégalité de Jensen : Prenez ensuite l'exponentielle des deux côtés: 1
Le côté droit est la moyenne géométrique puisque( x1⋅ x2⋅ … ⋅ xn)1 / n= exp( 1n∑jebûcheXje)
Quand l'inégalité AMGM se maintient-elle avec une quasi-égalité? Lorsque l'effet d'inégalité de Jensen est faible. Ce qui entraîne ici l'effet d'inégalité de Jensen, c'est la concavité, la courbure du logarithme. Si vos données sont réparties sur une zone où le logarithme a une courbure, l'effet sera important. Si vos données sont réparties dans une région où le logarithme est fondamentalement affine, alors l'effet sera faible.
Par exemple, si les données ont peu de variation, sont regroupées dans un voisinage suffisamment petit, le logarithme ressemblera à une fonction affine dans cette région (un thème du calcul est que si vous zoomez suffisamment sur une fonction continue et lisse, cela il ressemblera à une ligne). Pour des données suffisamment rapprochées, la moyenne arithmétique des données sera proche de la moyenne géométrique.
la source
Étudions la plage de étant donné que leur moyenne arithmétique (AM) est un petit multiple 1 + δ de leur moyenne géométrique (GM) (avec δ ≥ 0 ). Dans la question, δ ≈ 0,001 mais nous ne savons pas n .X1≤ x2≤ ⋯ ≤ xn 1 + δ δ≥ 0 δ≈ 0,001 n
Étant donné que le rapport de ces moyennes ne change pas lorsque les unités de mesure sont modifiées, choisissez une unité pour laquelle le GM est . Ainsi, nous cherchons à maximiser x n sous la contrainte que x 1 + x 2 + ⋯ + x n = n ( 1 + δ ) et x 1 ⋅ x 2 ⋯ x n = 1 .1 Xn X1+ x2+ ⋯ + xn= n ( 1 + δ) X1⋅ x2⋯ xn= 1
Cela se fera en faisant , disons, et x n = z ≥ x . AinsiX1= x2= ⋯ = xn - 1= x Xn= z≥ x
et
La solution est une racine entre 0 et 1 deX 0 1
Il est facilement trouvé de manière itérative. Voici les graphiques des et z optimaux en fonction de δ pour n = 6 , 20 , 50 , 150 , de gauche à droite:X z δ n = 6 , 20 , 50 , 150
Dès que atteint une taille appréciable, même un petit rapport de 1,001 correspond à un grand x n périphérique (les courbes rouges supérieures) et à un groupe de x i étroitement groupés (les courbes bleues inférieures).n 1,001 Xn Xje
À l'autre extrême, supposons que est pair (pour simplifier). La plage minimale est atteinte lorsque la moitié de x i est égale à une valeur x ≤ 1 et l'autre moitié à une autre valeur z ≥ 1 . Maintenant, la solution (qui est facilement vérifiable) estn = 2 k Xje x ≤ 1 z≥ 1
Pour les minuscules , nous pouvons ignorer le δ 2 comme approximation et également approcher la k ème racine au premier ordre, donnantδ δ2 ke
La plage est d'environ .32 δ---√/ n
la source