Quelles sont les principales différences entre les analyses taxométriques (par exemple, MAXCOV, MAXEIG) et les analyses de classe latente?

8

Des recherches récentes ont tenté de déterminer si certaines constructions psychologiques sont de dimension latente ou taxoniques (c'est-à-dire, y compris les taxons ou les classes). Par exemple, les chercheurs pourraient être intéressés à découvrir s'il existe une certaine «classe» de personnes qui sont plus susceptibles de développer une douleur chronique après une blessure, ou si le risque de développer une douleur chronique est mieux conceptualisé comme dimensionnel allant du risque limité à risque extrêmement élevé. J'ai remarqué que les chercheurs tentent de répondre à ces types de questions en utilisant deux types d'analyses: les analyses taxométriques (MAMBAC, MAXEIG, MAXCOV) généralement effectuées en R et les analyses de classe latente.

Voici quelques exemples d'études taxométriques:

Voici quelques exemples utilisant des analyses de classe latente:

Voici mes questions:

  1. En anglais, quelles sont les principales différences entre ces deux types d'analyses? Si possible, expliquez s'ils répondent à des questions différentes et en quoi ils sont analytiquement (mathématiquement) différents.

  2. Laquelle est la meilleure pour répondre au type de question que j'ai souligné dans mon "introduction", et pourquoi? C'est peut-être vraiment sans réponse à ce stade.

Veuillez également partager toute information que vous jugez pertinente pour ce sujet. J'ai le sentiment d'avoir des questions de suivi!

Behacad
la source

Réponses:

7

Voir Tueller (2010) , Tueller et Lubke (2010) et [Ruscio et al.'l livre] [3] pour des détails complets sur ce qui est résumé ci-dessous. Les procédures taxométriques fonctionnent généralement en calculant des statistiques simples sur un sous-ensemble de données triées. MAMBAC utilise la moyenne, MAXCOV utilise la covariance et MAXEIG utilise la valeur propre. L'analyse de classe latente est un cas particulier du modèle général de mélange variable latent (LVMM). Le LVMM spécifie un modèle pour les données qui peut inclure des classes latentes, des facteurs latents ou les deux. Les paramètres du modèle sont obtenus en utilisant le maximum de vraisemblance ou des estimations bayésiennes. Reportez-vous à la documentation ci-dessus pour plus de détails.

Plus important encore, les fondements mathématiques (qui dépassent le cadre de ce forum) sont les hypothèses qui peuvent être testées sous chaque approche. Les procédures taxométriques testent l'hypothèse

H1: Deux classes expliquent l'ensemble (ou la plupart) de la corrélation observée entre un ensemble d'indicateurs H0: Une (ou plusieurs) dimension (s) sous-jacente (s) continue (s) expliquent l'ensemble de la corrélation observée entre un ensemble d'indicateurs

Habituellement, le CCFI est utilisé pour vérifier quelle hypothèse rejeter / conserver. Voir [le livre de John Ruscio sur le sujet] [4]. Les procédures taxométriques ne peuvent tester que ces deux hypothèses et aucune autre.

Utilisée seule, l'analyse de classe latente ne peut pas tester l'hypothèse alternative taxométrique, H0 ci-dessus. Cependant, l'analyse de classe latente peut tester les hypothèses alternatives suivantes:

H1a: Deux classes expliquent toute la corrélation observée entre un ensemble d'indicateurs H1b: Trois classes expliquent toute la corrélation observée entre un ensemble d'indicateurs ... H1k: k les classes expliquent toute la corrélation observée entre un ensemble d'indicateurs

Pour tester H0 par le haut dans un cadre de variables latentes, ajustez un modèle d'analyse factorielle confirmatoire (CFA) à un seul facteur aux données (appelez ce H0cfa qui est différent de H0 - H0 teste uniquement une hypothèse d'ajustement dans le cadre taxométrique, mais ne le fait pas '' t produire des estimations de paramètres comme vous obtiendriez en ajustant un modèle CFA). Pour comparer H0cfa à H1a, H1b, ..., H1k, utilisez ala le critère d'information bayésien (BIC) [Nylund et al. (2007)] [5].

Pour résumer jusqu'à présent, les procédures taxométriques peuvent examiner des solutions à deux ou à une classe, tandis que la classe latente + CFA peut tester une à deux ou plusieurs solutions de classe. Nous voyons que les procédures taxométriques testent un sous - ensemble des hypothèses testées par des comparaisons classe latente + modèle CFA.

Toutes les hypothèses présentes jusqu'à présent sont des extrêmes aux deux extrémités d'un spectre. L'hypothèse la plus générale est qu'un certain nombre de classes latentes et un certain nombre de dimensions latentes (ou facteurs latents) expliquent le mieux les données. Les approches décrites ci-dessus rejettent purement et simplement cette hypothèse. Autrement dit, un modèle de classe latente et une procédure taxométrique qui mène à une conclusion de structure taxonique (plutôt que dimensionnelle) supposent au sein de la classe des différences individuelles en plus de l'erreur aléatoire. Dans votre contexte, cela équivaut à dire qu'au sein de la classe de la douleur chronique, il n'y a pas de variation systématique dans la tendance à développer une douleur chronique, seulement un hasard.

La faiblesse de cette hypothèse est mieux illustrée par un exemple tiré de la psychopathologie. Imaginons que vous disposiez d'un ensemble d'indicateurs de dépression et que vos modèles de classe taxométrique et / ou latente vous amènent à conclure qu'il existe une classe déprimée et une classe non déprimée. Ces modèles ne supposent implicitement aucune variance de la gravité de la dépression au sein de la classe (au-delà de l'erreur aléatoire ou du bruit). En d'autres termes, vous êtes déprimé ou non, et parmi les déprimés, tout le monde est également déprimé (au-delà de la variation des variables observées sujettes aux erreurs). Nous n'avons donc besoin que d'un seul traitement pour la dépression à un niveau de dose! On voit facilement que cette hypothèse est absurde pour la dépression et est souvent tout aussi limitée pour la plupart des autres contextes de recherche.

Pour éviter de faire cette hypothèse, utilisez une approche de modélisation de mélange de facteurs en suivant les articles de [Lubke et Muthen et Lubke et Neale] [6].

stueller
la source
(+1) Bienvenue sur notre site et merci d'avoir contribué à une réponse aussi bien développée!
whuber
Hou la la! J'ai presque l'impression que vous vous êtes inscrit juste pour répondre à cette question. Merci, très élucidant. Pourriez-vous peut-être nous expliquer comment éviter les limites que vous avez mises en évidence? Je suppose que cela a à voir avec une faible invariance (et similaire)? Le programme que j'utilise a la capacité de rendre les variances d'erreur indépendantes, les covariances d'erreur indépendantes et les effets de facteur indépendants. J'ai l'impression que c'est peut-être la bonne direction, mais en raison de la terminologie différente, il est difficile d'être certain.
Behacad