Quelle est la différence entre les modèles Logit et Probit ? Je suis plus intéressé par savoir quand utiliser la régression logistique et quand utiliser Probit. S'il existe une littérature qui le définit en utilisant R , cela serait également
Une généralisation de la régression linéaire permettant des relations non linéaires via une "fonction de liaison" et pour que la variance de la réponse dépende de la valeur prédite. (À ne pas confondre avec le «modèle linéaire général» qui étend le modèle linéaire ordinaire à la structure de covariance générale et à la réponse multivariée.)
Quelle est la différence entre les modèles Logit et Probit ? Je suis plus intéressé par savoir quand utiliser la régression logistique et quand utiliser Probit. S'il existe une littérature qui le définit en utilisant R , cela serait également
Quelles parcelles de diagnostic (et peut-être des tests formels) trouvez-vous le plus informatif pour les régressions où le résultat est une variable de comptage? Je suis particulièrement intéressé par les modèles de Poisson et binomiaux négatifs, ainsi que par leurs homologues à gonflement nul et...
La distribution gamma peut prendre une assez grande variété de formes et, étant donné le lien entre la moyenne et la variance à travers ses deux paramètres, elle semble appropriée pour traiter l'hétéroscédasticité dans des données non négatives, de manière à ce que les log ne vous faites pas sans...
Je commence à me familiariser avec l’utilisation de glmnetavec LASSO Regression, où mon résultat d’intérêt est dichotomique. J'ai créé un petit cadre de données fictif ci-dessous: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99,...
J'ai un ensemble de données avec environ 30 variables indépendantes et j'aimerais construire un modèle linéaire généralisé (GLM) pour explorer la relation entre elles et la variable dépendante. Je suis conscient que la méthode qui m'a été enseignée pour cette situation, la régression par étapes,...
Quelle est la différence entre les termes "fonction de lien" et "fonction de lien canonique"? De plus, y a-t-il des avantages (théoriques) à utiliser l'un par rapport à l'autre? Par exemple, une variable de réponse binaire peut être modélisée à l'aide de nombreuses fonctions de liaison telles que...
Comment interpréter les principaux effets (coefficients du facteur factice) dans une régression de Poisson? Supposons l'exemple suivant: treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13,...
En réponse à cette question, John Christie a suggéré d'évaluer l'adéquation des modèles de régression logistique en évaluant les résidus. Je sais comment interpréter les résidus dans les MCO, ils sont à la même échelle que le DV et très clairement la différence entre y et le y prévue par le modèle....
Il est souvent recommandé de prendre la racine carrée lorsque vous avez des données de comptage. (Pour des exemples sur CV, voir la réponse de @ HarveyMotulsky ici ou celle de @ whuber ici .) Par contre, lors de l'ajustement d'un modèle linéaire généralisé avec une variable de réponse distribuée...
Il existe plusieurs discussions sur ce site pour des recommandations de livres sur les statistiques d’introduction et l’apprentissage automatique, mais je cherche un texte sur les statistiques avancées, comprenant, par ordre de priorité: maximum de vraisemblance, modèles linéaires généralisés,...
J'essaie de comprendre la philosophie qui sous-tend l'utilisation d'un modèle linéaire généralisé (GLM) par rapport à un modèle linéaire (LM). J'ai créé un exemple de jeu de données ci-dessous où: bûche( y) = x + εbûche(y)=X+ε\log(y) = x + \varepsilon L'exemple n'a pas l'erreur en fonction de la...
Supposons que j'ai un objet de classe glm(correspondant à un modèle de régression logistique) et j'aimerais transformer les probabilités prédites données en predict.glmutilisant l'argument type="response"en réponses binaires, c'est-à-dire ou Y = 0 . Quel est le moyen le plus rapide et le plus...
Comment sont-ils toutes les versions de la même méthode statistique de
Comment interpréter la déviance nulle et résiduelle dans GLM in R? Comme, nous disons qu'un plus petit AIC est meilleur. Existe-t-il une interprétation similaire et rapide pour les déviances également? Déviance nulle: 1146.1 sur 1077 degrés de liberté Déviance résiduelle: 4589.4 sur 1099 degrés de...
Dans cet article intitulé "CHOISIR ENTRE DES MODÈLES LINÉAIRES GÉNÉRALISÉS APPLIQUÉS AUX DONNÉES MÉDICALES", les auteurs écrivent: Dans un modèle linéaire généralisé, la moyenne est transformée, par la fonction de lien, au lieu de transformer la réponse elle-même. Les deux méthodes de...
Je me demande si cela fait une différence d'interprétation si seules les variables dépendantes, indépendantes et dépendantes, ou uniquement les variables indépendantes sont transformées par un journal. Considérons le cas de log(DV) = Intercept + B1*IV + Error Je peux interpréter l'IV comme...
Je sais que quelque chose me manque dans ma compréhension de la régression logistique et apprécierais vraiment toute aide. Autant que je sache, la régression logistique suppose que la probabilité d'un résultat '1' compte tenu des entrées est une combinaison linéaire des entrées, passant par une...
Plus précisément, je veux savoir s’il existe une différence entre lm(y ~ x1 + x2)et glm(y ~ x1 + x2, family=gaussian). Je pense que ce cas particulier de glm est égal à lm. Ai-je
Je songe à construire un modèle prédisant un rapport , où et et . Le rapport serait donc compris entre et .a / bune/ba/ba ≤ bune≤ba \le ba > 0une>0a > 0b > 0b>0b > 0000111 Je pourrais utiliser la régression linéaire, bien qu'elle ne soit pas naturellement limitée à 0..1. Je n'ai aucune...
Cette question répond à une réponse donnée par @Greg Snow à une question que j’avais posée concernant l’analyse de puissance avec régression logistique et SAS Proc GLMPOWER. Si je conçois une expérience et que j'analyserai les résultats dans une régression logistique factorielle, comment puis-je...