Théorie de la réponse des éléments vs analyse des facteurs de confirmation

14

Je me demandais quelles sont les différences fondamentales et significatives entre la théorie de la réponse à l'item et l'analyse factorielle confirmatoire.

Je comprends qu'il y a des différences dans les calculs (en se concentrant davantage sur l'élément vs les covariances; log-linéaire vs linéaire).

Cependant, je n'ai aucune idée de ce que cela signifie d'un point de vue supérieur - cela signifie-t-il que l'IRT est meilleur que le CFA dans certaines circonstances? Ou à des fins finales légèrement différentes?

Toute réflexion serait utile car une analyse de la littérature de recherche a conduit à une description plus détaillée de l'IRT et du CFA que toute comparaison utile des différences fondamentales entre eux.

SimonsSchus
la source

Réponses:

7

La réponse de @Philchalmers est sur le point, et si vous voulez une référence de l'un des leaders dans le domaine, Muthen (créateur de Mplus), c'est parti: (Modifié pour inclure une citation directe)

Un utilisateur de MPlus demande: J'essaie de décrire et d'illustrer les similitudes et les différences actuelles entre CFA binaire et IRT pour ma thèse. La méthode d'estimation par défaut dans Mplus pour le CFA catégorique est WLSMV. Pour exécuter un modèle IRT, l'exemple de votre manuel suggère d'utiliser MLR comme méthode d'estimation. Lorsque j'utilise MLR, l'entrée de données est-elle toujours la matrice de corrélation tétrachorique ou la matrice de données de réponse d'origine est-elle utilisée?

Bengt Muthen répond: Je ne pense pas qu'il y ait de différence entre CFA de variables catégorielles et IRT. C'est parfois revendiqué mais je ne suis pas d'accord. L'estimateur généralement utilisé peut différer, mais ce n'est pas essentiel. MLR utilise les données brutes, pas un échantillon de matrice de corrélation tétrachorique. ... L'approche ML (R) est la même que l'approche "marginal ML (MML)" décrite par exemple dans le travail de Bock. Donc, en utilisant les données brutes et en intégrant sur les facteurs en utilisant l'intégration numérique. La MML est contrastée avec la "ML conditionnelle" utilisée par exemple avec les approches Rasch.

En supposant des facteurs normaux, des relations probit (ogive normale) élément-facteur et une indépendance conditionnelle, les hypothèses sont les mêmes pour ML et pour WLSMV, où ce dernier utilise la tétrachorique. En effet, ces hypothèses correspondent à l'hypothèse de variables de réponse latentes sous-jacentes normales multivariées derrière les résultats catégoriels. Ainsi, WLSMV n'utilise que des informations de premier et de second ordre, tandis que ML va jusqu'à l'ordre le plus élevé. Cependant, la perte d'informations semble faible. ML ne correspond pas au modèle à ces échantillons tétrachoriques, donc on peut peut-être dire que WLSMV se marginalise d'une manière différente. C'est une question de différences d'estimateur plutôt que de différences de modèle.

Nous avons une note IRT sur notre site Web:

http://www.statmodel.com/download/MplusIRT2.pdf

mais encore une fois, l'approche ML (R) n'est pas différente de celle utilisée dans IRT MML.

Source: http://www.statmodel.com/discussion/messages/9/10401.html?1347474605

robin.datadrivers
la source
2
Pourriez-vous peut-être copier-coller des citations pertinentes de Muthen dans votre réponse? Les réponses de lien uniquement sont généralement mal vues, en particulier parce que les liens ont tendance à pourrir.
amibe dit Réintégrer Monica
2
Je ne suis pas sûr d'être d'accord avec la déclaration de Muthen ici, car il semble définir l'IRT de manière très étroite. Oui, les modèles de réponse 2PL et gradués peuvent être compris dans un cadre SEM car ils ont de belles fonctions de liaison canoniques, et peuvent donc être réexprimés en utilisant d'autres statistiques suffisantes (comme les corrélations polychoriques). Mais qu'en est-il des autres modèles IRT plus courants, comme le modèle 3PL, le modèle ponctuel idéal, le modèle partiellement compensatoire, etc.? Bien sûr, certains modèles peuvent être compris dans un cadre SEM, mais je pense que mon point sur l'IRT tient toujours.
philchalmers
17

À certains égards, vous avez raison, CFA et IRT sont coupés dans le même tissu. Mais à bien des égards, ils sont également très différents. Le CFA, ou de manière plus appropriée l'item CFA, est une adaptation du cadre de modélisation d'équation structurelle / covariance pour tenir compte d'un type spécifique de covariation entre les éléments catégoriels. L'IRT concerne plus directement la modélisation des relations de variables catégorielles sans utiliser uniquement des informations de premier et de second ordre dans les variables (il s'agit d'informations complètes, donc ses exigences ne sont généralement pas aussi strictes).

L'item CFA présente plusieurs avantages en ce qu'il relève du cadre SEM et a donc une très large application aux systèmes multivariés de relations avec d'autres variables. L'IRT, d'autre part, se concentre principalement sur le test lui-même, bien que les covariables puissent également être incluses directement dans le test (par exemple, voir les rubriques sur l'IRT explicatif). J'ai également constaté que les relations de modélisation d'élément sont beaucoup plus générales dans le cadre de l'IRT dans la mesure où les modèles de réponse aux éléments non monotones, non paramétriques ou simplement personnalisés sont plus faciles à gérer car on n'a pas à se soucier de la suffisance d'utiliser la matrice de corrélation polychorique.

Les deux cadres ont leurs avantages et leurs inconvénients, mais en général, le CFA est plus flexible lorsque le niveau de modélisation abstraction / inférence est axé sur la relation au sein d'un système de variables, tandis que l'IRT est généralement préféré si le test lui-même (et les éléments qu'il contient) sont le centre d'intérêt.

philchalmers
la source
Merveilleux - c'est une belle et claire vue d'ensemble. Merci Phil.
SimonsSchus
2
Cela devrait être la réponse acceptée.
Vladislavs Dovgalecs
2

Je crois qu'Yves Rosseel en parle brièvement dans les diapositives 91-93 de son atelier de 2014: http://www.personality-project.org/r/tutorials/summerschool.14/rosseel_sem_cat.pdf

Extrait de Rosseel (2014, lien ci-dessus):

Approche de l'information complète: probabilité maximale marginale

origines: modèles IRT (par exemple Bock & Lieberman, 1970) et GLMM

...

la connexion avec l'IRT

• la relation théorique entre SEM et IRT est bien documentée:

Takane, Y., et De Leeuw, J. (1987). Sur la relation entre la théorie de la réponse des items et l'analyse factorielle des variables discrétisées. Psychome- trika, 52, 393-408.

Kamata, A. et Bauer, DJ (2008). Une note sur la relation entre l'analyse factorielle et les modèles théoriques de réponse aux items. Modélisation d'équations structurelles, 15, 136-153.

Joreskog, KG et Moustaki, I. (2001). Analyse factorielle des variables ordinales: comparaison de trois approches. Recherche comportementale multivariée, 36, 347-387.

quand sont-ils équivalents?

• probit (normal-ogive) versus logit: les deux métriques sont utilisées dans la pratique

• un CFA à facteur unique sur les éléments binaires équivaut à un modèle IRT à 2 paramètres (Birnbaum, 1968):

En CFA: ... En IRT: ... (voir diapo)

• un CFA à facteur unique sur les éléments polychotomiques (ordinaux) est équivalent au modèle de réponse graduée (Samejima, 1969)

• il n'y a pas d'équivalent CFA pour le modèle à 3 paramètres (avec un paramètre de devinette)

• le modèle Rasch est équivalent à un CFA à un seul facteur sur les éléments binaires, mais où tous les chargements de facteurs sont contraints d'être égaux (et la métrique probit est convertie en métrique logit)

Pier-Eric Chamberland
la source