Je dois créer des graphiques (similaires aux courbes de croissance) pour les enfants de 5 à 15 ans (seulement 5,6,7, etc.; il n'y a pas de valeurs fractionnaires comme 2,6 ans) pour une variable de santé qui est non négative, continue et la plage de 50 à 150 (avec seulement quelques valeurs en dehors de cette plage). Je dois créer des courbes de 90e, 95e et 99e centiles et également créer des tableaux pour ces centiles. La taille de l'échantillon est d'environ 8000.
J'ai vérifié et trouvé les moyens suivants:
Trouvez des quantiles, puis utilisez la méthode de loess pour obtenir une courbe lisse à partir de ces quantiles. Le degré de lissage peut être ajusté par le paramètre «span».
Utilisez la méthode LMS (Lambda-Mu-Sigma) (par exemple en utilisant des packages gamlss ou VGAM dans R).
Utilisez la régression quantile.
Utilisez la moyenne et l'écart-type de chaque groupe d'âge pour estimer le centile de cet âge et créer des courbes de centile.
Quelle est la meilleure façon de procéder? Par «meilleur», j'entends soit la méthode idéale qui est la méthode standard pour la création de telles courbes de croissance et serait acceptable pour tous. Ou une méthode plus facile et plus simple à implémenter, qui peut avoir certaines limites, mais est une méthode acceptable et plus rapide. (Par exemple, l'utilisation de loess sur les valeurs de centile est beaucoup plus rapide que l'utilisation du LMS du package gamlss).
Quel sera également le code R de base pour cette méthode.
Merci de votre aide.
Réponses:
Il existe une grande littérature sur les courbes de croissance. Dans mon esprit, il existe trois approches "top". Dans les trois, le temps est modélisé comme une spline cubique restreinte avec un nombre suffisant de nœuds (par exemple, 6). Il s'agit d'un lisseur paramétrique avec d'excellentes performances et une interprétation facile.
la source
Régression du processus gaussien . Commencez avec le noyau exponentiel au carré et essayez d'ajuster les paramètres à l'œil nu. Plus tard, si vous voulez faire les choses correctement, expérimentez différents noyaux et utilisez la probabilité marginale pour optimiser les paramètres.
Si vous voulez plus de détails que le tutoriel lié ci-dessus, ce livre est génial .
la source