Scores des facteurs à partir de réponses ordinales discrètes

12

Existe-t-il un moyen de principe d'estimer les scores des facteurs lorsque vous avez des variables ordinales discrètes.

J'ai variables ordinales, discrètes. Si je fais l'hypothèse que chaque réponse est sous-jacente à une variable continue, normalement distribuée, alors je peux calculer une matrice de corrélation polychorique . Je peux ensuite exécuter une analyse factorielle sur cette matrice et obtenir des chargements factoriels pour chaque variable.nn×n

Comment puis-je combiner les charges factorielles et les variables pour estimer les scores factoriels. Les moyens typiques d'estimer les scores semblent exiger que je traite les données ordinales comme des intervalles.

Je suppose que je pourrais avoir besoin de creuser plus profondément dans les entrailles de la corrélation polychorique pour trouver une fonction de lien.

fgregg
la source

Réponses:

8

L'approche `` fondée sur des principes '' (c'est-à-dire l'approche a priori défendable qui peut ne pas faire de différence empirique) consiste à utiliser un modèle de réponse graduée , un membre plutôt utile de la famille IRT souvent utilisé pour les éléments de type Likert. Le package R ltm rend cela très simple.

Vous supposez alors qu'il existe une relation de régression logistique ordinale entre le trait non observé et chacun de vos indicateurs. Le choix de cette classe de modèle vous permet de prendre au sérieux la nature ordinale des indicateurs et fournit des informations sur la partie du trait sur laquelle chaque élément est le plus informatif. Comme l'analyse factorielle, elle vous donne une erreur standard pour le score, bien que les personnes FA semblent les ignorer pour une raison quelconque.

D'un autre côté, le choix de cette classe de modèle limite votre capacité à faire toutes les choses classiques de l'analyse factorielle comme faire tourner des choses jusqu'à ce que vous les aimiez. Je pense que c'est un plus, mais les gens raisonnables ne sont pas d'accord. Si vous faites ce genre de chose pour savoir combien d'échelles vous avez, vous aurez envie de regarder les procédures Mokken qui essaient d'identifier les échelles, car la FA 's'adapte à une autre dimension et tourne à une structure simple' ça marche pas.

conjugateprior
la source
+1 mais quelle serait la justification pour envisager une rotation lorsque le GRM prend effectivement une échelle unidimensionnelle?
chl
@chl L'idée était que certaines personnes se tournent vers une structure simple pour pouvoir dire des choses comme «les indicateurs 1-4 mesurent une chose et les indicateurs 5-11 mesurent autre chose» sur la base des chargements tournés. La pensée connexe mais pas tout à fait identique à l'approche IRT serait de dire des choses comme: `` cette procédure Mokken me dit qu'il y a une échelle sous-jacente aux indicateurs 1-4 et une autre en dessous de 5-11 donc j'appliquerai mon modèle de réponse gradué à chacun sous-ensemble séparément ». J'espère que cela a plus de sens.
conjugateprior
Oui en effet. Merci d'avoir clarifié ce que j'ai extrapolé de votre dernière phrase. Nous n'avons toujours aucun moyen de relier chaque trait latent s'il se trouve qu'ils sont vraiment corrélés (à moins de regarder MIRT).
chl
8

Il est courant d'extraire les scores des facteurs des indicateurs à variable ordinale. Les chercheurs qui utilisent des mesures similaires le font tout le temps. Parce que les scores des facteurs sont basés sur la covariance, ce n'est généralement pas si grave que les "intervalles" ne soient pas uniformes à l'intérieur et entre les articles, en particulier si les articles sont comparables et utilisent des échelles raisonnablement compactes (par exemple, 5 ou 7 pt "d'accord / en désaccord "likert items): tous les sujets répondent aux mêmes items, et si les items sont en effet des mesures valides d'une variable latente, les réponses devraient afficher un modèle de covariance uniforme. Voir Gorsuch, RL (1983). Analyse factorielle. Hillsdale, NJ: Lawrence Erlbaum. 2e. éd., p. 119-20. Mais si cela vous dérange de supposer que les réponses pour vous les variables ordinales sont linéaires - ou même plus importantes, si vous voulez des scores factoriels qui ne sont pas linéaires mais reflètent des associations non linéaires récurrentes entre les éléments catégoriels (comme vous le feriez si vos variables étaient nominales ou qualitatives) - vous devriez utiliser une alternative de mise à l'échelle non linéaire à l'analyse factorielle conventionnelle, comme la classe latente analyse ou théorie de la réponse des items. (Il y a bien sûr une ressemblance familiale entre cette requête et votre requête sur l'utilisation des prédicteurs ordinaux dans les modèles de régression logit; peut-être que je peux encore une fois inspirer le chi ou quelqu'un d'autre qui en sait plus que moi pour nous offrir un compte encore plus fin pourquoi vous ne devez pas vous inquiéter - ou peut-être pourquoi vous devriez.) t linéaire mais reflète des associations non linéaires récurrentes entre les éléments catégoriels (comme vous le feriez si vos variables étaient nominales ou qualitatives) - vous devriez utiliser une alternative de mise à l'échelle non linéaire à l'analyse factorielle conventionnelle, telle que l'analyse de classe latente ou la théorie de la réponse des éléments. (Il y a bien sûr une ressemblance familiale entre cette requête et votre requête sur l'utilisation des prédicteurs ordinaux dans les modèles de régression logit; peut-être que je peux encore une fois inspirer le chi ou quelqu'un d'autre qui en sait plus que moi pour nous offrir un compte encore plus fin pourquoi vous ne devez pas vous inquiéter - ou peut-être pourquoi vous devriez.) t linéaire mais reflète des associations non linéaires récurrentes entre les éléments catégoriels (comme vous le feriez si vos variables étaient nominales ou qualitatives) - vous devriez utiliser une alternative de mise à l'échelle non linéaire à l'analyse factorielle conventionnelle, telle que l'analyse de classe latente ou la théorie de la réponse des éléments. (Il y a bien sûr une ressemblance familiale entre cette requête et votre requête sur l'utilisation des prédicteurs ordinaux dans les modèles de régression logit; peut-être que je peux encore une fois inspirer le chi ou quelqu'un d'autre qui en sait plus que moi pour nous offrir un compte encore plus fin pourquoi vous ne devez pas vous inquiéter - ou peut-être pourquoi vous devriez.)

dmk38
la source
4

Puis-je clarifier quelque chose ici s'il vous plaît, avez-vous des éléments notés sur différentes échelles que vous devez pré-traiter et combiner (intervalle, ordinal, nominal), ou cherchez-vous à faire une analyse factorielle sur des variables d'échelle ordinale seulement?

Si c'est le dernier - voici une approche.

http://cran.r-project.org/web/packages/Zelig/vignettes/factor.ord.pdf

(notez que ce lien est maintenant mort). Il y a d'autres vignettes , mais pas celle-ci.

user2238
la source
1
Voici une version miroir de la vignette originale, au cas où cela aiderait : bit.ly/x6eI4x .
chl
Ce code ne semble pas être implémenté
fgregg