Dans la littérature sur les modèles hiérarchiques / multiniveaux, j'ai souvent lu des articles sur les "modèles imbriqués" et les "modèles non imbriqués", mais qu'est-ce que cela signifie? Est-ce que quelqu'un pourrait peut-être me donner des exemples ou me parler des implications mathématiques de ce libellé?
61
Réponses:
Imbriqué ou non imbriqué peut signifier beaucoup de choses. Vous avez des dessins imbriqués par rapport aux dessins croisés (voir par exemple cette explication ). Vous avez des modèles imbriqués dans la comparaison de modèles. Imbriqué signifie ici que tous les termes d'un modèle plus petit apparaissent dans un modèle plus grand. C'est une condition nécessaire pour utiliser la plupart des tests de comparaison de modèles, tels que les tests de vraisemblance.
Dans le contexte des modèles à plusieurs niveaux, je pense qu'il est préférable de parler de facteurs imbriqués et non imbriqués. La différence réside dans la façon dont les différents facteurs sont liés les uns aux autres. Dans une conception imbriquée, les niveaux d'un facteur n'ont de sens que ceux d'un autre facteur.
Supposons que vous souhaitiez mesurer la production d'oxygène des feuilles. Vous échantillonnez un certain nombre d'espèces d'arbres et sur chaque arbre, vous échantillonnez des feuilles au bas, au milieu et au sommet de l'arbre. Ceci est une conception imbriquée. La différence pour les feuilles dans une position différente n'a de sens que dans une seule espèce d'arbre. Il est donc absurde de comparer les feuilles inférieures, les feuilles moyennes et les feuilles supérieures sur tous les arbres. Ou dit différemment: la position de la feuille ne doit pas être modélisée comme un effet principal.
Les facteurs non imbriqués sont une combinaison de deux facteurs non liés. Supposons que vous étudiez des patients et que vous vous intéressiez à la différence d'âge et de sexe. Donc, vous avez une classe d'agent et un facteur de sexe qui ne sont pas liés. Vous devriez modéliser à la fois l'âge et le sexe comme un effet principal, et vous pouvez examiner l'interaction si nécessaire.
La différence n'est pas toujours claire. Si, dans mon premier exemple, les espèces d'arbres sont étroitement liées sur le plan de la forme et de la physiologie, vous pouvez également considérer la position des feuilles comme un effet principal valable. Dans de nombreux cas, le choix d'un design imbriqué par rapport à un design non imbriqué est davantage une décision du chercheur qu'un fait réel.
la source
Les modèles imbriqués ou non imbriqués apparaissent dans l'analyse conjointe et l' IIA . Considérons le "problème de bus rouge de bus rouge". Vous avez une population où 50% des gens prennent une voiture pour se rendre au travail et les autres 50% prennent le bus rouge. Que se passe-t-il si vous ajoutez à l'équation un bus bleu répondant aux mêmes spécifications que le bus rouge? Un modèle logit multinomial prédit une part de 33% pour les trois modes. Nous savons intuitivement que ce n'est pas correct, car les bus rouge et bleu se ressemblent davantage que la voiture et prendront donc plus de parts de marché avant de prendre leur part de la voiture. C'est là qu'intervient une structure de nidification, qui est généralement spécifiée sous la forme d'un coefficient lambda dans les variantes similaires.
Ben Akiva a mis en place une série de diapositives décrivant bien la théorie sur ce ici . Il commence à parler de logit imbriqué autour de la diapositive 23.
la source
Un modèle est imbriqué dans un autre si vous pouvez toujours obtenir le premier modèle en contraignant certains des paramètres du second modèle. Par exemple, le modèle linéaire est imbriqué dans le polynôme à 2 degrés , car en définissant b = 0, le degré 2. Le polynôme devient identique à la forme linéaire. En d'autres termes, une ligne est un cas particulier d'un polynôme et les deux sont donc imbriqués.y = a x + b x 2 + cy=ax+c y=ax+bx2+c
Si deux modèles sont imbriqués, la principale implication est qu’il est relativement facile de les comparer statistiquement. En termes simples, avec des modèles imbriqués, vous pouvez considérer le plus complexe comme étant construit en ajoutant quelque chose à un "modèle nul" plus simple. Pour sélectionner le meilleur parmi ces deux modèles, il vous suffit donc de déterminer si cela ajoute quelque chose, ce qui explique une quantité importante de variance supplémentaire dans les données. Ce scénario équivaut en fait à adapter le modèle simple en premier et à supprimer sa variance prévue des données, puis à adapter la composante supplémentaire du modèle plus complexe aux résidus du premier ajustement (au moins avec l'estimation des moindres carrés).
Les modèles non imbriqués peuvent expliquer des parties entièrement différentes de la variance dans les données. Un modèle complexe peut même expliquer moins de variance qu'un modèle simple, si le modèle complexe n'inclut pas le "bon matériel" que possède le modèle simple. Dans ce cas, il est donc un peu plus difficile de prédire ce qui se passerait sous l'hypothèse nulle que les deux modèles expliquent les données de la même manière.
Plus précisément, sous l'hypothèse nulle (et compte tenu de certaines hypothèses modérées), la différence de qualité de l'ajustement entre deux modèles imbriqués suit une distribution connue, dont la forme dépend uniquement de la différence de degrés de liberté entre les deux modèles. des modèles. Ce n'est pas vrai pour les modèles non imbriqués.
la source
Deux modèles sont non liés ou distincts si l’un des modèles ne peut pas être défini comme limite de l’autre (ou un modèle n’est pas un cas particulier de l’autre)
la source
Vous avez demandé quelle était la différence entre les modèles imbriqués et non imbriqués. Voir:
Où le sujet des modèles non-imbriqués ou séparés a été traité pour la première fois ou dans mon prochain ouvrage: Choix de modèles séparés ou non-imbriqués .
la source
Voir une réponse plus simple dans ce pdf . Essentiellement, un modèle imbriqué est un modèle comportant moins de variables qu'un modèle complet. Une des intentions est de chercher des réponses plus parcimonieuses.
la source