Utiliser la longueur moyenne et le poids moyen pour calculer l'IMC moyen?

13

Est-il valable d'utiliser la longueur moyenne ( ) et le poids moyen ( )) d'une population donnée pour calculer l'indice de masse corporelle moyen ( ) pour cette population?hwBMI=wh2

Sophie Michel
la source
La question n'est pas si abstraite (selon le commentaire de @ JoeTaxpayer): les IMC typiques du monde réel (15.0-30.0) vont déjà être arrondis de toute façon à 1dp, donc si l'erreur dans l'IMC moyen due à l'utilisation du rapport des moyennes est ~ 0,05 -0,1 c'est mathématiquement négligeable (<1%); pour la plupart des distributions réelles de (taille, poids). Nous ne parlons pas de Laurel et Hardy ...
smci

Réponses:

18

Mathématiquement, ce n'est pas le cas que ceux-ci soient nécessairement proches. Cela fonctionnerait si c'était le cas que mais c'est faux en général et dans certaines situations particulières, cela pourrait être assez éloigné.E(Oui/X2)=E(Oui)/E(X)2

Cependant, pour un ensemble assez réaliste de données bivariées sur la taille et le poids, il semble que l'impact sera faible.

Par exemple, considérons le modèle pour la taille et le poids des hommes adultes américains dans Brainard et Burmaster (1992) [1]; ce modèle est une normale bivariée en taille et en log (poids), qui correspond assez bien aux données taille-poids et permet d'obtenir facilement des simulations réalistes. Un bon modèle pour les femmes est un peu plus compliqué, mais je ne m'attends pas à ce que cela fasse une grande différence dans la qualité de l'approximation de l'IMC; Je vais juste faire les mâles car un modèle très simple est assez bon.

En convertissant le modèle pour la taille et le poids des hommes en métrique et en simulant 100 000 points bivariés dans R avant de calculer les IMC individuels et donc l'IMC moyen, ainsi que de calculer la taille moyenne sur (poids moyen) au carré, il s'avère que le résultat était cet IMC moyen était (à quatre chiffres) 25,21 et était 25,22, ce qui semble assez proche.h¯/w¯2

En examinant l'effet de la variation des paramètres, il semble que l'impact de l'utilisation de l'estimateur biaisé des moyennes des variables pour les femmes serait probablement légèrement plus grand mais toujours pas suffisamment important pour que ce soit probablement un gros problème.

Idéalement, quelque chose de plus proche de la situation dans laquelle vous souhaitez l'utiliser doit être vérifié, mais cela va probablement être assez bon.

Donc, pour une situation typique, il semblerait que ce ne soit pas vraiment un problème dans la pratique.

[1]: Brainard, J. et Burmaster, DE (1992),
«Distributions bivariées pour la taille et le poids des hommes et des femmes aux États-Unis»,
Risk Analysis , vol. 12, n ° 2, p 267-275

Glen_b -Reinstate Monica
la source
10

Ce n'est pas tout à fait correct, mais cela ne fera généralement pas une énorme différence.

Par exemple, supposons que votre population pèse 80, 90 et 100 kg et mesure 1,7, 1,8 et 1,9 m de haut. Ensuite, les IMC sont 27,68, 27,78 et 27,70. La moyenne des IMC est de 27,72. Si vous calculez l'IMC à partir des moyennes des poids et des hauteurs, vous obtenez 27,78, ce qui est légèrement différent, mais ne devrait généralement pas faire toute la différence.

Stephan Kolassa
la source
Merci beaucoup pour votre réponse! Cela signifie donc que cette méthode de calcul ne serait probablement pas appropriée pour tout type d'analyse statistique, n'est-ce pas?
Sophie Michel
2
Honnêtement, je n'irais pas aussi loin. Les statistiques traitent de toute façon des données bruyantes, et une légère imprécision dans la mesure des hauteurs ou des poids éclipserait la différence que nous avons ici. Je vous recommande de simuler quelque chose dans ce sens avec les données que vous envisagez d'utiliser, puis de vous demander si ces minuscules différences auront vraiment un impact sur votre analyse statistique.
Stephan Kolassa
1
"Si vous calculez l'IMC à partir des moyennes des poids et des hauteurs, vous obtenez 27,78" Mais c'est égal au maximum des IMC! Obtenir le maximum au lieu de la moyenne me semble une grande différence.
Accumulation
@Acccumulation - Le point de Stephan était mort, mais le choix des nombres n'a pas bien illustré la situation. L'IMC pour "normal" est de 18,5 à 24,9. Les 3 IMC de l'exemple ont une plage basse à élevée de 0,1. Une différence de 1/2% sur ces données est le bruit. L'IMC d'un homme de 5'8 "passe de 27,4 à 27,5 à mesure que son poids passe de 180 à 181. 1 lb est la différence entre boire un grand verre d'eau avant ou après être monté sur la balance.
JTP - Excusez-vous auprès de Monica
@JoeTaxpayer: Je pense que votre point de vue est que les IMC typiques (15.0-30.0) vont déjà être arrondis de toute façon à 1dp, donc si l'erreur dans l'IMC moyen due à l'utilisation du rapport des moyennes est <0,05, elle est mathématiquement négligeable. Correct?
smci
3

Bien que je sois d'accord avec les autres réponses selon lesquelles il est probable que cette méthode se rapproche de l'IMC moyen, je voudrais souligner qu'il ne s'agit que d'une approximation.

Je suis en fait enclin à dire que vous ne devriez pas utiliser la méthode que vous décrivez, car elle est tout simplement moins précise. Il est trivial de calculer l'IMC pour chaque individu, puis de prendre la moyenne de cela, vous donnant l'IMC moyen réel.

Ici, j'illustre deux extrêmes, où les moyens de poids et de longueur restent les mêmes, mais l'IMC moyen est en fait différent:

Utilisation du code (matlab) suivant:

weight = [60, 61, 62, 100, 101, 102]; % OUR DATA
length = [1.5, 1.5, 1.5, 1.8, 1.8, 1.8;]; % OUR DATA
length = length.^2;
bmi = weight./length;
scatter(1:size(weight,2), bmi, 'filled');
yline(mean(bmi),'red','LineWidth',2);
yline(mean(weight)/mean(length),'blue','LineWidth',2);
xlabel('Person');
ylabel('BMI');
legend('BMI', 'mean(bmi)', 'mean(weight)/mean(length)', 'Location','northwest');

On a: mean_bmi2

Si nous réorganisons simplement les longueurs, nous obtenons un IMC moyen différent tandis que la moyenne (poids) / moyenne (longueur ^ 2) reste la même:

weight = [60, 61, 62, 100, 101, 102]; % OUR DATA
length = [1.8, 1.8, 1.8, 1.5, 1.5, 1.5;]; % OUR DATA (REORDERED)
... % rest is the same

dire bmi

Encore une fois, en utilisant des données réelles, il est probable que votre méthode se rapproche de l'IMC moyen réel, mais pourquoi utiliseriez-vous une méthode moins précise?

En dehors de la portée de la question: c'est toujours une bonne idée de visualiser vos données afin que vous puissiez réellement voir les distributions. Si vous remarquez certains clusters par exemple, vous pouvez également envisager d'obtenir des moyens séparés pour ces clusters (par exemple séparément pour les 3 premières et 3 dernières personnes dans mon exemple)

Deruijter
la source
2
"Il est trivial de calculer l'IMC pour chaque individu, puis de prendre la moyenne de cela, vous donnant l'IMC moyen réel." Oui, si vous avez les données brutes. Si vous ne disposez que de statistiques récapitulatives pour une population, comme la taille et le poids moyens, alors en dériver un "IMC de population" est le mieux que vous puissiez faire, et la question de la gravité d'une approximation qui est tout à fait valable.
Stephan Kolassa
1
+1 N'agrégez pas les agrégats si vous pouvez obtenir le même type de réponse en agrégeant les données brutes. Il y a des réponses et des commentaires selon lesquels, dans ce cas, cela fait peu / pas / mince / une différence négligeable, mais ne le faites pas. Apprenez et utilisez des pratiques saines sur l'analyse des données, faites-le de la bonne façon.
Stian Yttervik