J'ai six variables dépendantes (données de comptage) et plusieurs variables indépendantes, je vois que dans un MMR le script va comme ceci:
my.model <- lm(cbind(DV1,DV2,DV3,DV4,DV5,DV6) ~ IV1 + IV2 + ... + IVn)
Mais, comme mes données sont des nombres, je veux utiliser un modèle linéaire généralisé et j'ai essayé ceci:
my.model <- glm(cbind(DV1,DV2,DV3,DV4,DV5,DV6) ~ IV1 + IV2 + ... + IVn, family="poisson")
Et apparaît ce message d'erreur:
Error in glm.fit(x = c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, :
(subscript) logical subscript too long`
Quelqu'un peut-il m'expliquer ce message d'erreur ou un moyen de résoudre mon problème?
lm
lorsque vous lui donnez une matrice?lm(cbind(DV1,DV2,DV3,DV4,DV5,DV6) ~ IV1 + IV2 + ... + IVn)
Je doislm(cbind(DV1,DV2,DV3,DV4,DV5,DV6) ~ IV1 + IV2 + ... + IVn)
Je dois utiliser la commande manova () comme ceci:summary(manova(my.model))
pour faire une analyse multivariée de la variance et voir la signification de chaque variable indépendante. Voilà l'objectif final.summary
les donnera pour chaque DV.Réponses:
La réponse courte est que
glm
cela ne fonctionne pas comme ça. Lelm
créera desmlm
objets si vous lui donnez une matrice, mais cela n'est pas largement pris en charge dans les génériques et de toute façon ne pourrait pas facilement être généraliséglm
car les utilisateurs doivent pouvoir spécifier des variables dépendantes de deux colonnes pour les modèles de régression logistique.La solution est de monter les modèles séparément. Supposez que vos IV et DV vivent dans un data.frame appelé
dd
et sont étiquetés comme ils le sont dans votre question. Le code suivant fait une liste des modèles ajustés indexés par le nom de la variable dépendante qu'ils utilisent:Pour examiner les résultats, enveloppez simplement vos fonctions habituelles dans un
lapply
, comme ceci:Il existe sans aucun doute des façons plus élégantes de le faire dans R, mais cela devrait fonctionner.
la source
On m'a dit qu'il existe des modèles linéaires généralisés (mixtes) multivariés qui répondent à votre problème. Je ne suis pas un expert en la matière, mais j'aimerais consulter la documentation SABRE et ce livre sur les GLM multivariés. Peut-être qu'ils aident ...
la source
lm
une matrice pour une variable dépendante devrait probablement être considéré plus comme du sucre syntaxique que comme l'expression d'un modèle multivarié: s'il s'agissait d' un modèle multivarié (normal), ce serait celui où les erreurs sont '' sphérique ', c'est-à-dire où vous auriez pu exécuter des régressions distinctes sur chaque élément de la variable dépendante et obtenir la même réponse.