Quelles sont les raisons statistiques derrière la définition de l'indice d'IMC comme poids / taille ?

10

Peut-être que cette question a une réponse en médecine, mais y a-t-il des raisons statistiques pour lesquelles l' indice d'IMC est calculé comme ? Pourquoi pas par exemple juste ? Ma première idée est que cela a quelque chose à voir avec la régression quadratique. poids / tailleweight/height2weight/height


Échantillon de données réelles (200 individus avec poids, taille, âge et sexe):

structure(list(Age = c(18L, 21L, 17L, 20L, 19L, 53L, 27L, 22L, 
19L, 27L, 19L, 20L, 19L, 20L, 42L, 17L, 23L, 20L, 20L, 19L, 20L, 
19L, 19L, 18L, 19L, 15L, 19L, 15L, 19L, 21L, 60L, 19L, 17L, 23L, 
60L, 33L, 24L, 19L, 19L, 22L, 20L, 21L, 19L, 19L, 20L, 18L, 19L, 
20L, 22L, 20L, 20L, 27L, 19L, 22L, 19L, 20L, 20L, 21L, 16L, 19L, 
41L, 54L, 18L, 23L, 19L, 19L, 22L, 18L, 20L, 19L, 25L, 18L, 20L, 
15L, 61L, 19L, 34L, 15L, 19L, 16L, 19L, 18L, 15L, 20L, 20L, 20L, 
20L, 19L, 16L, 37L, 37L, 18L, 20L, 16L, 20L, 36L, 18L, 19L, 19L, 
20L, 18L, 17L, 22L, 17L, 22L, 16L, 24L, 17L, 33L, 17L, 17L, 15L, 
18L, 18L, 16L, 20L, 29L, 24L, 18L, 17L, 18L, 36L, 16L, 17L, 20L, 
16L, 43L, 19L, 18L, 20L, 19L, 18L, 21L, 19L, 20L, 23L, 19L, 19L, 
20L, 24L, 19L, 20L, 38L, 18L, 17L, 19L, 19L, 20L, 20L, 21L, 20L, 
20L, 42L, 17L, 20L, 25L, 20L, 21L, 21L, 22L, 19L, 25L, 19L, 40L, 
25L, 52L, 25L, 21L, 20L, 41L, 34L, 24L, 30L, 21L, 27L, 47L, 21L, 
16L, 31L, 21L, 37L, 20L, 22L, 19L, 20L, 25L, 23L, 20L, 20L, 21L, 
36L, 19L, 21L, 16L, 20L, 18L, 21L, 21L, 18L, 19L), Height = c(180L, 
175L, 178L, 160L, 172L, 172L, 180L, 165L, 160L, 187L, 165L, 176L, 
164L, 155L, 166L, 167L, 171L, 158L, 170L, 182L, 182L, 175L, 197L, 
170L, 165L, 176L, 167L, 170L, 168L, 163L, 155L, 152L, 158L, 165L, 
180L, 187L, 177L, 170L, 178L, 170L, 170L, NA, 188L, 180L, 161L, 
178L, 178L, 165L, 187L, 178L, 168L, 168L, 180L, 192L, 188L, 173L, 
193L, 184L, 167L, 177L, 177L, 160L, 167L, 190L, 187L, 163L, 173L, 
165L, 190L, 178L, 167L, 160L, 169L, 174L, 165L, 176L, 183L, 166L, 
178L, 158L, 180L, 167L, 170L, 170L, 180L, 184L, 170L, 180L, 169L, 
165L, 156L, 166L, 178L, 162L, 178L, 181L, 168L, 185L, 175L, 167L, 
193L, 160L, 171L, 182L, 165L, 174L, 169L, 185L, 173L, 170L, 182L, 
165L, 160L, 158L, 186L, 173L, 168L, 172L, 164L, 185L, 175L, 162L, 
182L, 170L, 187L, 169L, 178L, 189L, 166L, 161L, 180L, 185L, 179L, 
170L, 184L, 180L, 166L, 167L, 178L, 175L, 190L, 178L, 157L, 179L, 
180L, 168L, 164L, 187L, 174L, 176L, 170L, 170L, 168L, 158L, 175L, 
174L, 170L, 173L, 158L, 185L, 170L, 178L, 166L, 176L, 167L, 168L, 
169L, 168L, 178L, 183L, 166L, 165L, 160L, 176L, 186L, 162L, 172L, 
164L, 171L, 175L, 164L, 165L, 160L, 180L, 170L, 180L, 175L, 167L, 
165L, 168L, 176L, 166L, 164L, 165L, 180L, 173L, 168L, 177L, 167L, 
173L), Weight = c(60L, 63L, 70L, 46L, 60L, 68L, 80L, 68L, 55L, 
89L, 55L, 63L, 60L, 44L, 62L, 57L, 59L, 50L, 60L, 65L, 63L, 72L, 
96L, 50L, 55L, 53L, 54L, 49L, 72L, 49L, 75L, 47L, 57L, 70L, 105L, 
85L, 80L, 55L, 67L, 60L, 70L, NA, 76L, 85L, 53L, 69L, 74L, 50L, 
91L, 68L, 55L, 55L, 57L, 80L, 98L, 58L, 85L, 120L, 62L, 63L, 
88L, 80L, 57L, 90L, 83L, 51L, 52L, 65L, 92L, 58L, 76L, 53L, 64L, 
63L, 72L, 68L, 110L, 52L, 68L, 50L, 78L, 57L, 75L, 55L, 75L, 
68L, 60L, 65L, 48L, 56L, 65L, 65L, 88L, 55L, 68L, 74L, 65L, 62L, 
58L, 55L, 84L, 60L, 52L, 92L, 60L, 65L, 50L, 73L, 51L, 60L, 76L, 
48L, 50L, 53L, 63L, 68L, 56L, 68L, 60L, 70L, 65L, 52L, 75L, 65L, 
68L, 63L, 54L, 76L, 60L, 59L, 80L, 74L, 96L, 68L, 72L, 62L, 58L, 
50L, 75L, 70L, 85L, 67L, 65L, 55L, 78L, 58L, 53L, 56L, 72L, 62L, 
60L, 56L, 82L, 70L, 53L, 67L, 58L, 58L, 49L, 90L, 58L, 77L, 55L, 
70L, 64L, 98L, 60L, 60L, 65L, 74L, 99L, 49L, 47L, 75L, 77L, 74L, 
68L, 50L, 66L, 75L, 54L, 60L, 65L, 80L, 90L, 95L, 79L, 57L, 70L, 
60L, 85L, 44L, 58L, 50L, 88L, 60L, 54L, 68L, 56L, 69L), Gender = c(1L, 
1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 1L, 2L, 1L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 
1L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 1L, 2L, 1L, 2L, 
2L, 1L, 1L, 1L, 2L, 2L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 2L, 
1L, 1L, 1L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 
1L, 2L, 1L, 2L, 2L, 1L, 2L, 1L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, 
2L, 1L, 1L, 2L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, 1L, 
1L, 2L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 2L, 1L, 2L, 1L, 1L, 2L, 1L, 
1L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 1L, 1L, 2L, 
1L, 1L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 1L, 1L, 2L, 1L, 
2L, 1L, 1L, 1L, 2L, 1L, 1L, 2L, 2L, 1L, 1L, 1L, 2L, 2L, 1L, 2L, 
1L, 1L, 1L, 1L, 1L, 1L, 2L, 1L, 2L, 2L, 1L, 1L, 1L, 2L, 1L, 1L, 
1L, 2L, 1L, 1L, 2L, 2L, 1L)), .Names = c("Age", "Height", "Weight", 
"Gender"), row.names = 304:503, class = "data.frame")
Miroslav Sabo
la source
5
De nos jours, des formules comme celle-ci abandonneraient une régression linéaire du log (poids) contre le log (taille), ce qui (pour des raisons biologiques et statistiques) est un moyen plus naturel d'analyser ces quantités.
whuber
8
J'avais espéré illustrer cela avec des données réelles. Le premier hit de Google trouvé sur les «données de taille de poids» est un grand ensemble de données hébergé par UCLA . C'est clairement truqué! Les distributions marginales sont parfaitement réparties normalement (les tests SW avec des sous-échantillons de 5000 ont presque toujours des valeurs de p proches de 1/2): pas de valeurs aberrantes, pas de faible kurtosis (d'un mélange de genres), pas d'asymétrie (d'un mélange d'âges). Ces données auraient été "utilisées pour développer ... les courbes de croissance de Hong Kong pour ... l'indice de masse corporelle (IMC)". C'est extrêmement louche.
whuber
3
Merci, mais ces données peuvent être trop limitées pour donner une bonne idée de la façon dont la taille et le poids co-varient. Au minimum, ils doivent être classés par sexe et par âge. Il est clair, cependant, qu'il vaut mieux analyser les logarithmes de la taille et du poids: ils réduisent l'hétéroscédasticité à laquelle se réfère @ttnphns et ils contribuent également à rendre les distributions des résidus plus symétriques. Il est intéressant de noter qu'une régression du poids des billes en fonction de la hauteur des billes donne une pente de . Cela se compare presque exactement à l'estimation de Quetelet de 5/2 citée par AdamO. cinq / 2 = 2,52.55±0.285/2=2.5
whuber
4
Comparer library(MASS); rlm(log(Weight) ~ log(Height) + cut(Age, 3) + as.factor(Gender), data=y)à rlm(Weight ~ Height + cut(Age, 3) + as.factor(Gender), data=y)(et les diagnostics de tracé pour les deux crises) pour voir l'effet salutaire d'utiliser logarithmes: ils se stabilisent en effet et Symétriser les résidus. Dans les deux modèles, le sexe est important, tout comme l'âge; la relation avec l'âge n'est pas linéaire. Il est très intéressant de noter que le coefficient de log (hauteur) dans le premier modèle se situe désormais autour de au lieu de . ( vos données avec les valeurs manquantes sont supprimées.) Je ne vois aucune interaction. 2,51.62.5y
whuber
3
@whuber, j'ai essayé votre code avec une taille d'échantillon complète (n = 1336) et un coefficient de log (hauteur) d'environ 1,77.
Miroslav Sabo

Réponses:

13

Cette revue, par Eknoyan (2007) a bien plus que ce que vous vouliez probablement savoir sur Quetelet et son invention de l'indice de masse corporelle.

La version courte est que l'IMC semble approximativement normalement distribué, tandis que le poids seul, ou le poids / taille ne le fait pas, et Quetelet était intéressé à décrire un homme "normal" via des distributions normales. Il existe également des arguments sur les premiers principes, basés sur la croissance des gens, et des travaux plus récents ont tenté de relier cette réduction à la biomécanique.

Il convient de noter que la valeur de l'IMC est assez vivement débattue. Cela correspond assez bien à la graisse, mais les seuils pour l'insuffisance pondérale / l'embonpoint / l'obésité ne correspondent pas tout à fait aux résultats des soins de santé.

Matt Krause
la source
10
Plus important encore, il a considéré weight/height^3ce qui serait interprété comme une densité (intuitivement logique), mais a opté pour l'IMC classique en raison de sa distribution normale, comme vous l'avez dit.
AdamO
4
@AdamO Cependant, les adultes ne grandissent généralement que dans 2 des 3 dimensions ...
James
10

Extrait du "Traité sur l'homme et le développement de ses facultés" d'Adolphe Quetelet:

Si l'homme augmentait également dans toutes les dimensions, son poids à différents âges serait comme le cube de sa taille. Maintenant, ce n'est pas ce que nous observons vraiment. L'augmentation de poids est plus lente, sauf pendant la première année après la naissance; alors la proportion que nous venons de signaler est assez régulièrement observée. Mais après cette période, et jusqu'à l'âge de la puberté, le poids augmente presque comme le carré de la taille. Le développement du poids redevient très rapide à la puberté et s'arrête presque après la vingt-cinquième année. En général, nous ne nous trompons pas beaucoup quand nous supposons que pendant le développement les carrés du poids à différents âges sont comme les cinquièmes puissances de la taille; ce qui conduit naturellement à cette conclusion, en soutenant la constante de gravité spécifique, que la croissance transversale de l'homme est inférieure à la verticale.

Voyez ici .

Il n'était pas intéressé par la caractérisation de l'obésité mais par la relation entre le poids et la taille car il était très intéressé par la biométrie et les courbes en cloche. Les résultats de Quetelet ont indiqué que l'IMC avait une distribution à peu près normale dans la population. Cela signifiait pour lui qu'il avait trouvé la relation "correcte". (fait intéressant, seulement une décennie ou deux plus tard, Francis Galton aborderait la question de la "distribution de la hauteur" dans les populations et inventerait le terme "régression vers la moyenne").

Il convient de noter que l'IMC a été un fléau de la biométrie dans les temps modernes en raison de l'utilisation poussée de l'IMC dans l'étude de Framingham comme moyen d'identifier l'obésité. Il n'y a toujours pas de bon prédicteur de l'obésité (et de ses effets sur la santé). Le rapport de mesure taille / hanche est un candidat prometteur. Espérons que les échographies deviennent moins chères et meilleures, les médecins les utiliseront pour identifier non seulement l'obésité, mais les dépôts graisseux et la calcification dans les organes et formuler des recommandations de soins en fonction de celles-ci.

AdamO
la source
1
L'expression «les carrés du poids à différents âges sont comme les cinquièmes puissances de la taille» me suggère . Dans tous les cas, la citation n'est pas liée à différents adultes avec des hauteurs différentes mais à un individu en cours de développement2.5
Henry
1
Quetelet infère sur le développement de l'individu à partir de l'observation d'un échantillon basé sur la population. Je pense qu'il ajoute que, en moyenne, on peut bien faire avec un poids et une taille liés à 2,5 exposants (sur toutes les tranches d'âge ou la plupart), mais spécifiquement chez les adultes, la relation est quadratique.
AdamO
1
Je pense que le rapport taille / hanche a été réellement considéré par Quetelet ou ses contemporains, mais a également été rejeté car il n'était pas normalement distribué non plus. Le chemin parcouru ...
Matt Krause
8

L'IMC est principalement utilisé de nos jours en raison de sa capacité à approximer le volume de graisse viscérale abdominale, utile dans l'étude du risque cardiovasculaire. Pour une étude de cas analysant l'adéquation de l'IMC dans le dépistage du diabète, voir le chapitre 15 de http://biostat.mc.vanderbilt.edu/CourseBios330 sous Documents . Plusieurs évaluations sont là. Vous verrez qu'une meilleure puissance de hauteur est plus proche de 2,5 mais vous pouvez faire mieux que d'utiliser la taille et le poids.

Frank Harrell
la source
2
Il s'agit d'un excellent commentaire - mais il ne semble pas répondre à la question demandant des "raisons statistiques" sous-jacentes à la formule standard de l'IMC.
whuber
1
C'est dans la citation Quetelet ci-dessus.
Frank Harrell