Je conseillais un étudiant-chercheur ayant un problème particulier et je souhaitais obtenir l'avis des autres sur ce site.
Le contexte:
Le chercheur avait trois types de variables prédictives. Chaque type contenait un nombre différent de variables prédictives. Chaque prédicteur était une variable continue:
- Social: S1, S2, S3, S4 (c.-à-d. Quatre prédicteurs)
- Cognitif: C1, C2 (c.-à-d. Deux prédicteurs)
- Comportemental: B1, B2, B3 (c.-à-d. Trois prédicteurs)
La variable de résultat était également continue. L'échantillon comprenait environ 60 participants.
Le chercheur a voulu commenter le type de prédicteurs les plus importants pour expliquer la variable de résultat. Cela était lié à des préoccupations théoriques plus larges concernant l'importance relative de ces types de prédicteurs.
Des questions
- Quelle est la bonne façon d'évaluer l'importance relative d'un ensemble de prédicteurs par rapport à un autre ensemble?
- Quelle est une bonne stratégie pour gérer le fait qu'il existe différents nombres de prédicteurs dans chaque ensemble?
- Quelles mises en garde d'interprétation pourriez-vous suggérer?
Toute référence à des exemples ou discussion de techniques serait également la bienvenue.
la source
Suggestions
Avertissements
la source
Importance
La première chose à faire est de rendre opérationnelle «l'importance des prédicteurs». Je suppose que cela signifie quelque chose comme «la sensibilité du résultat moyen aux changements de valeurs des prédicteurs». Étant donné que vos prédicteurs sont regroupés, la sensibilité du résultat moyen à des groupes de prédicteurs est plus intéressante qu'une analyse variable par variable. Je laisse ouverte si la sensibilité est comprise de façon causale. Ce problème est repris plus tard.
Trois version d'importance
Beaucoup de variance expliquée : Je suppose que le premier port d'escale des psychologues est probablement une décomposition de variance conduisant à une mesure de la variance des résultats expliquée par la structure variance-covarance dans chaque groupe de prédicteurs. N'étant pas expérimentaliste, je ne peux pas suggérer grand-chose ici, sauf pour noter que tout le concept de `` variance expliquée '' est un peu sans fondement à mon goût, même sans le problème `` quelle somme de quels carrés ''. D'autres sont invités à ne pas être d'accord et à le développer.
Grands coefficients standardisés : SPSS propose la version bêta (mal nommée) pour mesurer l'impact d'une manière comparable d'une variable à l'autre. Il y a plusieurs raisons de ne pas l'utiliser, discutées dans le manuel de régression de Fox, ici et ailleurs. Tous s'appliquent ici. Il ignore également la structure du groupe.
D'un autre côté, j'imagine que l'on pourrait standardiser les prédicteurs dans les groupes et utiliser les informations de covariance pour juger de l'effet d'un mouvement d'écart type sur chacun d'eux. Personnellement, la devise: "si une chose ne vaut pas la peine d'être faite, ça ne vaut pas la peine de bien le faire" atténue mon intérêt à le faire.
Grands effets marginaux : L'autre approche consiste à rester à l'échelle des mesures et à calculer les effets marginaux entre des points d'échantillonnage soigneusement choisis. Parce que vous êtes intéressé par les groupes, il est utile de choisir des points pour faire varier les groupes de variables plutôt que les seuls, par exemple en manipulant les deux variables cognitives à la fois. (Beaucoup d'opportunités pour des parcelles cool ici). Papier de base ici . Le
effects
package en R le fera très bien.Il y a deux mises en garde ici:
Si vous faites cela, vous voudrez faire attention à ne pas choisir deux variables cognitives qui, bien que individuellement plausibles, par exemple les médianes, sont conjointement loin de toute observation de sujet.
Certaines variables ne sont même pas théoriquement manipulables, de sorte que l'interprétation des effets marginaux comme causaux est plus délicate, bien que toujours utile.
Différents prédicteurs
Des problèmes surviennent en raison de la structure de covariance des variables groupées, que nous essayons normalement de ne pas craindre mais pour cette tâche.
En particulier lors du calcul des effets marginaux (ou des coefficients standardisés d'ailleurs) sur des groupes plutôt que sur des variables uniques, la malédiction de la dimensionnalité pour les grands groupes facilitera les comparaisons dans les régions où il n'y a pas de cas. Plus de prédicteurs dans un groupe conduisent à un espace plus peu peuplé, donc toute mesure d'importance dépendra plus des hypothèses du modèle et moins des observations (mais ne vous le dira pas ...) Mais ce sont les mêmes problèmes que dans la phase d'ajustement du modèle vraiment. Certainement les mêmes que ceux qui se poseraient dans une évaluation d'impact causal basée sur un modèle.
la source
Une méthode consiste à combiner les ensembles de variables en variables de faisceau. Cette méthode a été largement utilisée en sociologie et dans des domaines connexes.
Réfs:
Whitt, Hugh P. 1986. "The Sheaf Coefficient: A Simplified and Expanded Approach". Recherche en sciences sociales 15: 174-189.
la source