Je mène des recherches sur la relation entre le rang de naissance d'une personne et le risque ultérieur d'obésité en utilisant les données de plusieurs cohortes de naissance d'un an (par exemple http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2908417/ ).
Un défi majeur est que l'ordre de naissance est lié à d'autres caractéristiques telles que l'âge maternel, le nombre de frères et sœurs plus jeunes et / ou plus âgés et l'espacement des naissances, qui peuvent également influencer le résultat via différents mécanismes. De plus, toute influence de ces éléments sur le risque d'obésité ultérieur pourrait être modifiée par la composition par sexe des frères et sœurs, y compris l '«enfant index» (le participant de la cohorte de naissance).
Pour chaque enfant index, on pouvait tracer une chronologie qui montrait toutes les naissances dans la famille, l'âge maternel étant variable dans le temps.
J'essaie d'identifier des méthodes pour analyser ces types de données, où l'ordre, le calendrier et la nature des événements pourraient tous être importants. Je pose cette question ici en raison de la diversité des applications avec lesquelles les membres travaillent - je m'attends à ce que quelqu'un ait des suggestions immédiates qui me prendront beaucoup plus de temps à m'identifier seul. Tout coup de pouce dans la bonne direction serait grandement apprécié.
Question (s) connexe (s): Comment dois-je analyser les données sur les intervalles de naissance des femmes?
Réponses:
Vous pourriez envisager d'utiliser des modèles à plusieurs niveaux (régression mixte) pour estimer les effets inter et intra familiaux. Une stratégie possible consiste à utiliser une approche planifiée de construction de modèles hiérarchiques. Par exemple, testez chaque prédicteur potentiel dans un modèle univarié. Si les effets entre familles suppriment l'effet d'ordre de naissance, cela suggère fortement que l'ordre de naissance n'est pas important mais que d'autres influences le sont. Un exemple de citation pour cela pour les effets de l'ordre de naissance sur le QI:
J'espère que cela vous sera utile.
la source
J'aborde cette question comme une question statistique et je n'ai aucune connaissance particulière des problèmes médicaux.
En regardant l'article auquel vous faites référence, je constate qu'une cohorte comptait 970 individus. Si vous disposez de données sur plusieurs cohortes d'environ cette taille, la taille globale de votre ensemble de données offre la possibilité de sélectionner des sous-ensembles raisonnablement grands dans lesquels la chronologie de chaque individu remplit des conditions spécifiques. Par exemple, un sous-ensemble pourrait comprendre, disons, tous les individus de sexe masculin âgés de 25 à 29 ans. Une régression, pour un tel sous-ensemble, d'une mesure appropriée de l'obésité ultérieure par rapport au rang de naissance éliminerait tout effet possible sur l'obésité ultérieure des différences de sexe de l'enfant indice et éliminerait en grande partie tout effet possible de l'âge maternel.
Il n'est pas simple d'étendre cette approche au sexe des frères et sœurs, car si une condition pour un sous-ensemble était, par exemple, que l'enfant index ait une sœur plus âgée, cela implique que l'enfant index n'est pas lui-même un enfant aîné, ce qui rétrécit la fourchette de la variable indépendante dans la régression. Cependant, un moyen de contourner ce problème pourrait être de définir les conditions en utilisant «le cas échéant». Par exemple, un sous-ensemble pourrait être défini pour inclure tous les hommes de 25 à 29 ans et les frères et sœurs plus âgés, le cas échéant, toutes les femmes. Un tel sous-ensemble inclurait toujours des individus avec n'importe quel ordre de naissance.
Si un sous-ensemble était défini par un ensemble de conditions trop complexes, le nombre d'individus qu'il contiendrait pourrait être si petit que les estimations des coefficients qui en résulteraient seraient trop imprécises pour être utiles. Si cette approche était adoptée, il faudrait probablement trouver un compromis de jugement, dans la définition des sous-ensembles, entre l'élimination du plus grand nombre possible d'effets et l'inclusion d'un nombre suffisant d'individus pour produire un résultat utile.
la source
Je suggérerais une analyse des données fonctionnelles, mais je pense que vous pourriez avoir beaucoup de familles avec trop peu d'enfants pour obtenir des estimations raisonnables. Allez-y et lisez-le, car il répond à vos besoins. Peut-être que quelqu'un l'a déjà utilisé avec des données similaires.
Si vous ne voulez pas faire quelque chose d'aussi massivement non paramétrique que cela, vous devez utiliser votre expertise clinique pour réduire la dimensionnalité des données. Par exemple, une variable dans votre modèle pourrait être le nombre d'enfants, une autre pourrait être le nombre moyen d'années entre les enfants, etc. S'il y a un effet dans ces variables, il peut apparaître même si vous n'avez pas correctement spécifié la forme fonctionnelle immédiatement. La construction de modèles davantage basée sur les connaissances peut vous permettre de construire un modèle hautement prédictif - assurez-vous simplement de conserver un ensemble de validation!
la source