Est-il possible d'avoir une équation de régression (multiple) avec deux variables dépendantes ou plus? Bien sûr, vous pouvez exécuter deux équations de régression distinctes, une pour chaque DV, mais cela ne semble pas capturer une relation quelconque entre les deux DV?
regression
Jeff
la source
la source
Réponses:
Oui c'est possible. Ce qui vous intéresse est ce qu'on appelle "Régression Multivariée Multiple" ou simplement "Régression Multivariée". Je ne sais pas quel logiciel vous utilisez, mais vous pouvez le faire avec R.
Voici un lien qui fournit des exemples.
http://www.public.iastate.edu/~maitra/stat501/lectures/MultivariateRegression.pdf
la source
@ La réponse de Brett est correcte.
Si vous souhaitez décrire votre structure en deux blocs, vous pouvez également utiliser la régression PLS . Fondamentalement, il s’agit d’un cadre de régression qui repose sur l’idée de construire des combinaisons linéaires successives (orthogonales) des variables appartenant à chaque bloc, de sorte que leur covariance soit maximale. Nous considérons ici qu'un bloc contient des variables explicatives et l'autre variable de réponses , comme indiqué ci-dessous:YX Y
Nous cherchons des "variables latentes" qui représentent un maximum d'informations (de manière linéaire) incluses dans le bloc tout en permettant de prédire le bloc avec une erreur minimale. Les et sont les chargements (combinaisons linéaires) associés à chaque dimension. Les critères d'optimisation se lisentY u j v jX Y uj vj
où représente le bloc dégonflé (c'est-à-dire résidualisé) après la régression . X h thXh−1 X hth
La corrélation entre les scores factoriels sur la première dimension ( et ) reflète la magnitude du lien -ω 1 X Yξ1 ω1 X Y
la source
La régression multivariée est effectuée dans SPSS à l'aide de l'option GLM-multivariée.
Mettez tous vos résultats (DV) dans la zone des résultats, mais tous vos prédicteurs continus dans la zone des covariables. Vous n'avez besoin de rien dans la boîte de facteurs. Regardez les tests multivariés. Les tests univariés seront identiques à des régressions multiples distinctes.
Comme quelqu'un d'autre l'a dit, vous pouvez également spécifier cela en tant que modèle d'équation structurelle, mais les tests sont les mêmes.
(Fait intéressant, eh bien, je pense que c'est intéressant, il existe une légère différence entre le Royaume-Uni et les États-Unis. Au Royaume-Uni, la régression multiple n'est généralement pas considérée comme une technique multivariée. La régression multivariée n'est donc multivariée que si vous obtenez plusieurs résultats / valeurs. )
la source
Je le ferais en transformant d’abord les variables de régression en variables calculées par PCA, puis en régressant avec les variables calculées par PCA. Bien sûr, je stockerais les vecteurs propres pour pouvoir calculer les valeurs pca correspondantes lorsque j'ai un nouvel exemple à classer.
la source
Comme mentionné par caracal, vous pouvez utiliser le paquetage mvtnorm dans R. En supposant que vous ayez créé un modèle lm (nommé "modèle") de l' une des réponses de votre modèle et que vous l'appeliez "modèle", voici comment obtenir la distribution prédictive multivariée de plusieurs réponses "resp1", "resp2", "resp3" stockées dans une matrice Y:
Maintenant, les quantiles de ysim sont des intervalles de tolérance aux attentes bêta de la distribution prédictive, vous pouvez bien sûr utiliser directement la distribution échantillonnée pour faire ce que vous voulez.
Pour répondre à Andrew F., les degrés de liberté sont donc nu = N- (M + F) +1 ... N étant le nombre d'observations, M le nombre de réponses et F le nombre de paramètres par modèle d'équation. nu doit être positif.
(Vous voudrez peut-être lire mon travail dans ce document :-))
la source
Avez-vous déjà rencontré le terme "corrélation canonique"? Là vous avez des ensembles de variables du côté indépendant aussi bien que du côté dépendant. Mais peut-être y a-t-il des concepts plus modernes disponibles, les descriptions que j'ai sont toutes les années 80/90 ...
la source
C'est ce qu'on appelle un modèle d'équation structurelle ou un modèle d'équation simultanée.
la source