Existe-t-il des méthodes simples pour transformer les données de niveau ordinal en niveau d'intervalle (tout comme il en existe pour l'inverse)? Et exécutable dans Excel ou SPSS?
Ayant les données, disons: 10 questions au niveau ordinal (disons échelle 0-5, où 0 = "pas du tout", 5 = "tout le temps"), je veux les transformer afin qu'elles puissent être traitées comme appropriées données de niveau d'intervalle à des fins de tests paramétriques (distribution normale, tests non paramétriques hors de question).
Serait extrêmement reconnaissant pour les réponses!
Réponses:
Cette réponse discutera des modèles possibles du point de vue de la mesure , où l'on nous donne un ensemble de variables ou mesures corrélées observées (manifestes), dont la variance partagée est supposée mesurer une construction bien identifiée mais pas directement observable (généralement, dans une réflexion manière), qui sera considérée comme une variable latente . Si vous n'êtes pas familier avec le modèle de mesure des caractères latents, je recommanderais les deux articles suivants: L'attaque des psychométriciens , par Denny Borsbooom, et Latent Variable Modeling: A Survey , par Anders Skrondal et Sophia Rabe-Hesketh. Je vais d'abord faire une légère digression avec des indicateurs binaires avant de traiter des éléments avec plusieurs catégories de réponses.
Une façon de transformer les données de niveau ordinal en échelle d'intervalle consiste à utiliser une sorte de modèle de réponse d'élément . Un exemple bien connu est le modèle Rasch , qui étend l'idée du modèle de test parallèle de la théorie de test classique pour faire face aux éléments binaires.grâce à un modèle linéaire à effets mixtes généralisé (avec lien logit) (dans une partie de l'implémentation logicielle «moderne»), où la probabilité d'approuver un élément donné est fonction de la «difficulté de l'élément» et de la «capacité de la personne» (en supposant qu'il n'y a pas interaction entre sa position sur le caractère latent mesuré et l'emplacement de l'élément sur la même échelle logit - qui pourrait être capturé par un paramètre de discrimination d'élément supplémentaire, ou interaction avec des caractéristiques spécifiques à l'individu - qui est appelé fonctionnement différentiel de l'élément ). La construction sous-jacente est supposée être unidimensionnelle, et la logique du modèle Rasch est simplement que le répondant a une certaine `` quantité de construction '' - parlons de la responsabilité du sujet (sa `` capacité ''),θ θ . Pour donner un exemple concret, considérons la question suivante: "J'ai eu du mal à me concentrer sur autre chose que mon anxiété" (oui / non). Une personne souffrant de troubles anxieux est plus susceptible de répondre positivement à cette question par rapport à un individu choisi au hasard dans la population générale et n'ayant pas d'antécédents de dépression ou de troubles liés à l'anxiété.
(Ici, les réponses aux éléments de type Likert ont été recodées sous forme de réponses binaires (1/2 = 0, 3-5 = 1), et nous considérons que chaque élément est également discriminant entre les individus, d'où le parallélisme entre les pentes de la courbe des éléments (Rasch modèle).)
Pour les articles polytomiques avec des catégories ordonnées, il existe plusieurs choix: le modèle de crédit partiel , le modèle d'échelle de notation ou le modèle de réponse graduée , pour n'en nommer que quelques-uns qui sont principalement utilisés dans la recherche appliquée. Les deux premiers appartiennent à la soi-disant "famille Rasch" des modèles IRT et partagent les propriétés suivantes: (a) la monotonie de la fonction de probabilité de réponse (courbe de réponse item / catégorie), (b) la suffisance du score individuel total (avec latent paramètre considéré comme fixe), (c) ce qui signifie que, en fonction du caractère latent, les réponses sont indépendantes des variables externes spécifiques à l'individu (par exemple, le sexe, l'âge, l'ethnicité, le SSE). indépendance locale signifiant que les réponses aux items sont indépendantes, conditionnelles au trait latent, et (d) absence de fonctionnement différentiel des items
En étendant l'exemple précédent au cas où les cinq catégories de réponse sont effectivement prises en compte, un patient aura une probabilité plus élevée de choisir la catégorie de réponse 3 à 5, par rapport à une personne échantillonnée dans la population générale, sans antécédent de troubles liés à l'anxiété. Comparés à la modélisation de l'élément dichotomique décrite ci-dessus, ces modèles prennent en compte soit le seuil cumulatif (par exemple, les chances de répondre à 3 contre 2 ou moins), soit le seuil de catégorie adjacente (les chances de répondre à 3 contre 2), qui est également discuté dans la catégorie d'Agresti. L'analyse des données(chapitre 12). La principale différence entre les modèles susmentionnés réside dans la façon dont les transitions d'une catégorie de réponse à l'autre sont gérées: le modèle de crédit partiel ne suppose pas que la différence entre un emplacement de seuil donné et la moyenne des emplacements de seuil sur le trait latent est égale ou uniforme entre les articles, contrairement au modèle d'échelle de notation. Une autre différence subtile entre ces modèles est que certains d'entre eux (comme la réponse graduelle non contrainte ou le modèle de crédit partiel) permettent des paramètres de discrimination inégaux entre les éléments. Voir Application de la modélisation de la théorie de la réponse aux éléments pour évaluer les propriétés des éléments et de l'échelle du questionnaire , par Reeve et Fayers, ou La base de la théorie de la réponse aux éléments , par Frank B. Baker, pour plus de détails.
Parce que dans le cas précédent, nous avons discuté de l'interprétation des courbes de probabilité des réponses pour les éléments notés de manière dichotomique, examinons les courbes de réponse des éléments dérivées d'un modèle de réponse gradué, en mettant en évidence les mêmes éléments cibles:
(Modèle de réponse gradué sans contrainte, permettant une discrimination inégale entre les éléments.)
Ici, les observations suivantes méritent réflexion:
En plus d'être considérés comme de véritables modèles de mesure , ce qui rend les modèles de Rasch attractifs, c'est que les scores de somme, en tant que statistique suffisante , peuvent être utilisés comme substituts des scores latents. De plus, la propriété de suffisance implique aisément la séparabilité des paramètres du modèle (personnes et items) (dans le cas des items polytomiques, il ne faut pas oublier que tout s'applique au niveau de la catégorie de réponse des items), d'où l'additivité conjointe.
Un bon examen de la hiérarchie de modèle IRT, avec R mise en œuvre, est disponible dans Mair et l'article de Hatzinger publié dans le Journal of Statistical Software : Extended Rasch Modélisation: Le paquet pour l'application eRM des modèles IRT en R . D'autres modèles incluent des modèles log-linéaires , un modèle non paramétrique, comme le modèle Mokken , ou des modèles graphiques .
En dehors de R, je ne connais pas les implémentations d'Excel, mais plusieurs packages statistiques ont été proposés sur ce fil: Comment commencer à appliquer la théorie de la réponse aux éléments et quel logiciel utiliser?
Enfin, si vous souhaitez étudier les relations entre un ensemble d'éléments et une variable de réponse sans avoir recours à un modèle de mesure, une certaine forme de quantification variable via une mise à l'échelle optimale peut également être intéressante. Outre les implémentations R discutées dans ces threads, des solutions SPSS ont également été proposées sur les threads associés .
Les références
la source
Dans son livre Analysis of Ordinal Categorical Data , Alan Agresti en couvre plusieurs. L'un d'eux est ridits, dont je discute sur mon blog
la source