Quels sont les différents types de codages disponibles pour les variables catégorielles (en R) et quand les utiliseriez-vous?

14

Si vous ajustez un modèle linéaire ou un modèle mixte, il existe différents types de codages disponibles pour transformer une varibale catégorielle ou nominale en un certain nombre de variables pour lesquelles les paramètres sont estimés, tels que le conditionnement fictif (la valeur par défaut R) et le codage des effets.

J'ai entendu dire que le codage d'effets (parfois appelé codage de déviation ou de contraste) est préférable lorsque vous avez des interactions, mais quels sont les contrastes possibles et quand utiliseriez-vous quel type de contraste?

Le contexte est une modélisation mixte dans R utilisant lme4, mais je pense que des réponses plus larges sont très bien. Désolé, si j'ai raté une question similaire.

EDIT: Deux liens utiles sont: le codage d'effet et le codage factice expliqués.

Henrik
la source
si vous avez des statistiques appliquées modernes avec S-Plus, il y a une grande section dans le chapitre six sur cette même question
richiemorrisroe
4
Je ne pense pas que vous trouverez une réponse complète à votre question, mais il y a beaucoup de bonnes informations sur les différents types de codages ici .
gung - Rétablir Monica
@gung Le site a l'air vraiment intéressant. Cependant, il ne semble pas couvrir le codage de contraste (ou existe-t-il un autre nom pour cela).
Henrik
Je ne suis pas sûr; Je me demande s'il y a une mauvaise communication. Le titre de cette page est "codage de contraste".
gung - Rétablir Monica
1
Je ne comprends pas très bien quelle question reste. Si vous vouliez une liste de différents types de codages, vous l'avez. Quelle est la principale orientation de votre question maintenant?
gung - Rétablir Monica

Réponses:

4

D'autres peuvent m'éclairer si je me trompe, mais voilà…

Quel est l'effet du niveau par rapport à la moyenne des niveaux précédents? c'est-à-dire que vous souhaitez localiser le seuil de l'effet

  • Utilisez les contrastes Helmert. Je pense à cela comme des comparaisons cumulatives. Je l'ai utilisé pour déterminer une limite dose-réponse aux médicaments de l'exposition. La comparaison avec plusieurs niveaux à la fois signifie que moins d'informations sont jetées. Je pense à cela comme des comparaisons cumulatives.

Quel est l'effet du niveau par rapport à un niveau de référence? c'est-à-dire que vous êtes intéressé par un groupe de comparaison de référence.

  • Utilisez un codage variable fictif (contrastes de traitement). Je pense à cela comme des comparaisons de base. Je l'ai utilisé lorsqu'il y a généralement un groupe / niveau établi comme important par d'autres études, et mon étude démontre que des associations existent également lorsque ce seuil est dépassé.

Quel est l'effet de deux niveaux adjacents d'une variable?

  • Utilisez la différenciation avant / arrière. Je pense à cela comme des comparaisons successives à court intervalle. Je l'ai utilisé pour comparer les effets de différents niveaux de position socioéconomique, lorsque chaque groupe est différent sur le plan de la composition et n'a pas plus d'intérêt que les autres.
Gavin
la source