Quelle est la différence entre les modèles Logit et Probit ? Je suis plus intéressé par savoir quand utiliser la régression logistique et quand utiliser Probit. S'il existe une littérature qui le définit en utilisant R , cela serait également
Une transformation d'un paramètre régissant une distribution de réponse qui est utilisée comme une partie cruciale du modèle linéaire généralisé pour mapper la plage de ce paramètre (qui peut être de 0 à 1, ou seulement des valeurs positives, par exemple) à la droite numérique réelle ( - ∞ , + ∞ ) (-∞,+∞) .
Quelle est la différence entre les modèles Logit et Probit ? Je suis plus intéressé par savoir quand utiliser la régression logistique et quand utiliser Probit. S'il existe une littérature qui le définit en utilisant R , cela serait également
Quelle est la différence entre les termes "fonction de lien" et "fonction de lien canonique"? De plus, y a-t-il des avantages (théoriques) à utiliser l'un par rapport à l'autre? Par exemple, une variable de réponse binaire peut être modélisée à l'aide de nombreuses fonctions de liaison telles que...
J'essaie de comprendre la philosophie qui sous-tend l'utilisation d'un modèle linéaire généralisé (GLM) par rapport à un modèle linéaire (LM). J'ai créé un exemple de jeu de données ci-dessous où: bûche( y) = x + εbûche(y)=X+ε\log(y) = x + \varepsilon L'exemple n'a pas l'erreur en fonction de la...
Quel est le but de la fonction de lien en tant que composante du modèle linéaire généralisé? Pourquoi en avons-nous besoin? Wikipédia déclare: Il peut être pratique de faire correspondre le domaine de la fonction de liaison à la plage de la moyenne de la fonction de distribution. Quel est...
J'ai une question sur la sémantique sur laquelle j'aimerais avoir l'avis de mes collègues statisticiens. Nous savons que des modèles tels que la logistique, Poisson, etc. tombent sous l'égide de modèles linéaires généralisés. Le modèle comprend des fonctions non linéaires des paramètres, qui...
La précision est définie comme: p = true positives / (true positives + false positives) Est - il exact que, true positiveset false positivesapproche 0, la précision approche 1? Même question pour rappel: r = true positives / (true positives + false negatives) J'implémente actuellement un test...
Presque tout ce que j'ai lu sur la régression linéaire et GLM se résume à ceci: où est une fonction non croissante ou non décroissante de et est le paramètre que vous estimer et tester des hypothèses sur. Il existe des dizaines de fonctions de liaison et de transformations de et pour faire de une...
J'ai des données de densité de poisson que j'essaie de comparer entre plusieurs techniques de collecte différentes, les données ont beaucoup de zéros et l'histogramme semble approprié pour une distribution de poisson, sauf que, comme densités, ce ne sont pas des données entières. Je suis...
J'ai pensé à ce problème. La fonction logistique habituelle pour la modélisation des données binaires est: Cependant, la fonction logit, qui est une courbe en forme de S , toujours le meilleur pour modéliser les données? Vous avez peut-être des raisons de croire que vos données ne suivent pas la...
J'ai un modèle linéaire généralisé qui adopte une distribution gaussienne et une fonction de liaison logarithmique. Après avoir ajusté le modèle, je vérifie les résidus: tracé QQ, résidus vs valeurs prédites, histogramme des résidus (reconnaissant qu'il faut faire preuve de prudence). Tout a l'air...
Contexte: J'essaie de suivre l'examen de Princeton de l'estimation MLE pour GLM . Je comprends les bases de l' estimation MLE: likelihood, score, observée et attendue Fisher informationet la Fisher scoringtechnique. Et je sais comment justifier une régression linéaire simple avec une estimation MLE...
Je pensais que la fonction de lien canonique venait du paramètre naturel de la famille exponentielle. Disons, considérons la famille puis est la fonction de lien canonique. Prenons la distribution de Bernoulli comme exemple, nous avons Ainsi, la fonction de lien
J'effectue une régression de Poisson dans le but final de comparer (et de prendre la différence de) les comptes moyens prévus entre deux niveaux de facteurs dans mon modèle: , tout en maintenant d'autres covariables du modèle (qui sont toutes binaires) constantes. Je me demandais si quelqu'un...
Étant donné le même ensemble de covariables et de familles de distribution, comment comparer des modèles ayant différentes fonctions de liaison? Je pense que la bonne réponse ici est "AIC / BIC", mais je ne suis pas sûr à 100%. Est-il possible d'avoir des modèles imbriqués s'ils ont un lien...
Pour un exemple simple, supposons qu'il existe deux modèles de régression linéaire Modèle 1 a trois prédicteurs, x1a, x2betx2c Le modèle 2 a trois prédicteurs du modèle 1 et deux prédicteurs supplémentaires x2aetx2b Il existe une équation de régression de la population où la variance de la...
Je veux adapter un modèle linéaire de R avec family=binomial(link="identity"), cependant, la famille binomiale n'a pas de lien d'identité. Que devrais-je
Je travaille actuellement à modéliser les décès dus au sida au fil du temps à l'aide d'un GLM dans R. Je sais qu'il existe deux options possibles pour la fonction de lien pour les données de Poisson, le logarithme et la racine carrée. Je sais que la racine carrée atténuerait les problèmes de...
J'essaie d'estimer un modèle de choix professionnel avec trois choix. Existe-t-il des alternatives à l'utilisation de la régression logistique multinomiale lors de la gestion de ces résultats catégoriels non ordonnés? Lorsqu'il s'agit de variables dépendantes binaires, il semble y avoir plusieurs...
Ici, j'étudie des modèles linéaires généralisés. Je sais que cette question est assez naïve et simple, mais je ne sais pas exactement pourquoi la fonction canonique de lien est si utile. Quelqu'un pourrait-il me donner une intuition sur ce