Est-il toujours valable d'inclure une interaction bidirectionnelle dans un modèle sans inclure les effets principaux? Et si votre hypothèse ne concerne que l'interaction, avez-vous encore besoin d'inclure les principaux
Les paramètres d'un modèle de régression. Le plus souvent, les valeurs par lesquelles les variables indépendantes seront multipliées pour obtenir la valeur prédite de la variable dépendante.
Est-il toujours valable d'inclure une interaction bidirectionnelle dans un modèle sans inclure les effets principaux? Et si votre hypothèse ne concerne que l'interaction, avez-vous encore besoin d'inclure les principaux
Comment interpréter les principaux effets (coefficients du facteur factice) dans une régression de Poisson? Supposons l'exemple suivant: treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13,...
Je me demande si cela fait une différence d'interprétation si seules les variables dépendantes, indépendantes et dépendantes, ou uniquement les variables indépendantes sont transformées par un journal. Considérons le cas de log(DV) = Intercept + B1*IV + Error Je peux interpréter l'IV comme...
J'essaie de créer un ajustement polynomial du second ordre à certaines données que j'ai. Disons que je trace cette correspondance avec ggplot(): ggplot(data, aes(foo, bar)) + geom_point() + geom_smooth(method="lm", formula=y~poly(x, 2)) Je reçois: Ainsi, un ajustement de deuxième ordre fonctionne...
Je ne sais même pas si cette question a du sens, mais quelle est la différence entre la régression multiple et la corrélation partielle (mis à part les différences évidentes entre corrélation et régression, ce que je ne vise pas)? Je veux comprendre ce qui suit: J'ai deux variables indépendantes (...
Fermé. Cette question est hors sujet . Il n'accepte pas actuellement de réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé il y a 2 ans . J'utilise caret pour exécuter une forêt aléatoire validée de façon...
Je viens de tomber sur cet article , qui décrit comment calculer la répétabilité (aka fiabilité, aka corrélation intraclasse) d'une mesure via la modélisation d'effets mixtes. Le code R serait: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit)...
Lorsque j'utilise GAM, cela me donne un DF résiduel de (dernière ligne du code). Qu'est-ce que ça veut dire? Au-delà de l'exemple GAM, en général, le nombre de degrés de liberté peut-il être un nombre non entier?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call:...
Au début, je pensais que l'ordre n'avait pas d'importance, mais j'ai ensuite lu au sujet du processus d'orthogonalisation gram-schmidt pour calculer les coefficients de régression multiple, et maintenant j'ai des doutes. Selon le processus gram-schmidt, plus une variable explicative est indexée...
Pour une régression linéaire simple, le coefficient de régression peut être calculé directement à partir de la matrice de variance-covariance CCC , par Cd,eCe,eCd,eCe,e C_{d, e}\over C_{e,e} oùdddest l'indice de la variable dépendante eteeeest l'indice de la variable explicative. Si l'on n'a que la...
Lorsque nous effectuons plusieurs régressions et disons que nous examinons le changement moyen de la variable pour un changement d'une variable , en maintenant toutes les autres variables constantes, à quelles valeurs maintenons-nous les autres variables constantes? Leur moyenne? Zéro? De n'importe...
J'ai étudié le package de démarrage dans R et bien que j'aie trouvé un certain nombre de bonnes amorces sur la façon de l'utiliser, je n'ai encore rien trouvé qui décrive exactement ce qui se passe "dans les coulisses". Par exemple, dans cet exemple , le guide montre comment utiliser les...
Je me demande quelle est la relation exacte entre le partiel et les coefficients dans un modèle linéaire et si je ne devrais utiliser qu'un seul ou les deux pour illustrer l'importance et l'influence des facteurs.R2R2R^2 Pour autant que je sache, avec summaryj'obtiens des estimations des...
Quelqu'un pourrait-il me conseiller sur la façon d'interpréter les estimations à partir d'une régression logistique en utilisant un lien de cloglog? J'ai installé le modèle suivant dans lme4: glm(cbind(dead, live) ~ time + factor(temp) * biomass, data=mussel, family=binomial(link=cloglog)) Par...
J'ai exécuté un modèle mixte linéaire généralisé dans R et inclus un effet d'interaction entre deux prédicteurs. L'interaction n'était pas significative, mais les principaux effets (les deux prédicteurs) l'étaient tous les deux. Maintenant, de nombreux exemples de manuels me disent que s'il y a un...
J'utilise scikit-learn de Python pour former et tester une régression logistique. scikit-learn renvoie les coefficients de régression des variables indépendantes, mais il ne fournit pas les erreurs standard des coefficients. J'ai besoin de ces erreurs standard pour calculer une statistique de Wald...
Dans une régression linéaire multiple, il est possible de trouver le coefficient avec la formule suivante. b=(X′X)−1(X′)Yb=(X′X)−1(X′)Ouib = (X'X)^{-1}(X')Y beta = solve(t(X) %*% X) %*% (t(X) %*% Y) ; beta Par exemple: > y <- c(9.3, 4.8, 8.9, 6.5, 4.2, 6.2, 7.4, 6, 7.6, 6.1) > x0 <-...
Je crois que le concept ß 0 est la moyenne lorsque la variable nominale est égale à 0 (ou est le groupe de référence), ce qui donne l'interprétation d'extrémité que le coefficient de régression est la différence moyenne des deux catégories. Même avec> 2 catégories Je suppose que chaque β...
Je me rends compte que c'est une question très fondamentale, mais je ne trouve de réponse nulle part. Je calcule les coefficients de régression en utilisant les équations normales ou la décomposition QR. Comment puis-je calculer les erreurs standard pour chaque coefficient? Je pense généralement...
Lorsque vous faites un GLM et que vous obtenez l'erreur "non défini en raison des singularités" dans la sortie anova, comment peut-on contrer cette erreur? Certains ont suggéré que cela est dû à la colinéarité entre les covariables ou que l'un des niveaux n'est pas présent dans l'ensemble de...