À la suite de mes articles précédents, pour autant que je puisse comprendre, si j'ai trois coefficients de corrélation, je devrai les tester par paires pour voir s'il y a une différence significative entre eux.
Cela signifie que je devrais utiliser la transformation Fishers pour calculer le score z de r, puis la valeur p de z (ce que les calculatrices recommandées dans les articles précédents font, heureusement), puis vérifier si la valeur p est supérieure ou inférieure à ma valeur alpha (0,05) pour chaque paire.
c.-à-d. si les 21 à 30 ans sont du groupe d'âge 1, 31 à 40 ans du groupe d'âge 2 et 41 à 50 ans du groupe d'âge 2, ma comparaison des corrélations entre leurs habitudes d'achat et la perte de poids serait:
- Groupe 1 vs Groupe 2
- Groupe 1 vs Groupe 3
- Groupe 2 vs Groupe 3
Au lieu de faire trois calculs distincts, existe-t-il un moyen de faire tous ces calculs en une seule étape?
la source
Réponses:
Votre question est un parfait exemple de modèles de régression avec des prédicteurs quantitatifs et qualitatifs . Plus précisément, les trois groupes d'âge - - sont les variables qualitatives et les variables quantitatives sont les habitudes d'achat et la perte de poids (je suppose que c'est parce que vous calculez les corrélations).1,2,&3
Je dois souligner que c'est une bien meilleure façon de modéliser que de calculer des corrélations séparées par groupe, car vous avez plus de données à modéliser, donc vos estimations d'erreur (valeurs p, etc.) seront plus fiables. Une raison plus technique est les degrés de liberté plus élevés qui en résultent dans la statistique du test t pour tester la signification des coefficients de régression.
Fonctionnant selon la règle selon laquelle les prédicteurs qualitatifs peuvent être gérés par variables d'indicateur, seules deux variables d'indicateur, , sont nécessaires ici et sont définies comme suit:c c−1 X1,X2
Cela implique que le groupe est représenté par ; représenter votre réponse - habitude achats en et la perte de poids variable explicative quantitative comme . Vous êtes maintenant adapté à ce modèle linéaire3 X1=0,X2=0 Y W
Comment font les tests que vous demandez. Fondamentalement, une fois que vous avez ajusté le modèle et obtenu les estimations, vous devez tester certains contrastes. Spécifiquement pour vos comparaisons:
la source
Le test par paire dans cette situation n'est pas (encore) justifié par la description des données. Vous devez utiliser des méthodes de régression à variables multiples. Un appel R peut être:
La construction de 3 catégories n'est pas la meilleure méthode pour contrôler l'âge (ou analyser sa contribution si telle est la question principale), car la catégorisation peut fausser les relations continues et les termes splines éliminent la nécessité de choisir des points de partage arbitraires. Une fois qu'il y aura suffisamment de preuves d'une association de changement de poids après une analyse appropriée, des options de test ad hoc pourront être déployées.
(Je suis d'accord avec la plupart de ce que @whuber a exprimé dans un commentaire, et je trouve généralement son commentaire faisant autorité, mais je ne comprends pas sa position concernant les approches de régression.)
la source