Quelle est la différence entre les modèles Logit et Probit ? Je suis plus intéressé par savoir quand utiliser la régression logistique et quand utiliser Probit. S'il existe une littérature qui le définit en utilisant R , cela serait également
Quelle est la différence entre les modèles Logit et Probit ? Je suis plus intéressé par savoir quand utiliser la régression logistique et quand utiliser Probit. S'il existe une littérature qui le définit en utilisant R , cela serait également
Quelle est la différence entre les termes "fonction de lien" et "fonction de lien canonique"? De plus, y a-t-il des avantages (théoriques) à utiliser l'un par rapport à l'autre? Par exemple, une variable de réponse binaire peut être modélisée à l'aide de nombreuses fonctions de liaison telles que...
J'essaie de comprendre la philosophie qui sous-tend l'utilisation d'un modèle linéaire généralisé (GLM) par rapport à un modèle linéaire (LM). J'ai créé un exemple de jeu de données ci-dessous où: bûche( y) = x + εbûche(y)=X+ε\log(y) = x + \varepsilon L'exemple n'a pas l'erreur en fonction de la...
Une distribution gaussienne normalisée sur peut être définie en donnant explicitement sa densité: 1RR\mathbb{R}12π−−√e−x2/212πe−x2/2 \frac{1}{\sqrt{2\pi}}e^{-x^2/2} ou sa fonction caractéristique. Comme rappelé dans cette question, il s'agit également de la seule distribution pour laquelle la...
Je me demande si cela fait une différence d'interprétation si seules les variables dépendantes, indépendantes et dépendantes, ou uniquement les variables indépendantes sont transformées par un journal. Considérons le cas de log(DV) = Intercept + B1*IV + Error Je peux interpréter l'IV comme...
J'espère que quelqu'un pourra expliquer, en termes simples, ce qu'est une fonction caractéristique et comment elle est utilisée dans la pratique. J'ai lu qu'il s'agissait de la transformation de Fourier du pdf, alors je suppose que je sais ce que c'est, mais je ne comprends toujours pas son but. Si...
Quel est le but de la fonction de lien en tant que composante du modèle linéaire généralisé? Pourquoi en avons-nous besoin? Wikipédia déclare: Il peut être pratique de faire correspondre le domaine de la fonction de liaison à la plage de la moyenne de la fonction de distribution. Quel est...
Fermé. Cette question est hors sujet . Il n'accepte pas actuellement de réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé il y a 2 ans . J'utilise caret pour exécuter une forêt aléatoire validée de façon...
Je lis sur la fonction quantile, mais ce n'est pas clair pour moi. Pourriez-vous fournir une explication plus intuitive que celle fournie ci-dessous? Puisque le cdf est une fonction augmentant de façon monotone, il a un inverse; notons ceci par . Si est le cdf de , alors est la valeur de telle que...
J'ai une question sur la sémantique sur laquelle j'aimerais avoir l'avis de mes collègues statisticiens. Nous savons que des modèles tels que la logistique, Poisson, etc. tombent sous l'égide de modèles linéaires généralisés. Le modèle comprend des fonctions non linéaires des paramètres, qui...
La précision est définie comme: p = true positives / (true positives + false positives) Est - il exact que, true positiveset false positivesapproche 0, la précision approche 1? Même question pour rappel: r = true positives / (true positives + false negatives) J'implémente actuellement un test...
Presque tout ce que j'ai lu sur la régression linéaire et GLM se résume à ceci: où est une fonction non croissante ou non décroissante de et est le paramètre que vous estimer et tester des hypothèses sur. Il existe des dizaines de fonctions de liaison et de transformations de et pour faire de une...
Je viens de remarquer que l'intégration de la fonction quantile d'une variable aléatoire univariée (cdf inverse) de p = 0 à p = 1 produit la moyenne de la variable. Je n'ai jamais entendu parler de cette relation auparavant, alors je me demande: est-ce toujours le cas? Si oui, cette relation...
J'essaie de comprendre le lien entre la fonction de génération de moment et la fonction caractéristique. La fonction de génération de moment est définie comme: MX( t ) = E( exp( t X) ) = 1 + t E( X)1+ t2E( X2)2 !+ ⋯ + tnE( Xn)n !MX(t)=E(exp(tX))=1+tE(X)1+t2E(X2)2!+⋯+tnE(Xn)n! M_X(t) = E(\exp(tX))...
J'ai des données de densité de poisson que j'essaie de comparer entre plusieurs techniques de collecte différentes, les données ont beaucoup de zéros et l'histogramme semble approprié pour une distribution de poisson, sauf que, comme densités, ce ne sont pas des données entières. Je suis...
Je pense que j'ai une certaine confusion fondamentale sur le fonctionnement des fonctions de régression logistique (ou peut-être simplement des fonctions dans leur ensemble). Comment se fait-il que la fonction h (x) produise la courbe vue à gauche de l'image? Je vois qu'il s'agit d'un tracé de deux...
J'ai pensé à ce problème. La fonction logistique habituelle pour la modélisation des données binaires est: Cependant, la fonction logit, qui est une courbe en forme de S , toujours le meilleur pour modéliser les données? Vous avez peut-être des raisons de croire que vos données ne suivent pas la...
Inspiré par mon autre question , j'aimerais savoir comment trouver le mode d'une fonction de densité de probabilité (PDF) d'une fonction ?f(x)f(x)f(x) Existe-t-il une procédure de "livre de cuisine" pour cela? Apparemment, cette tâche est beaucoup plus difficile qu'il n'y paraît au...
On dit souvent que la régression du processus gaussien correspond (GPR) à la régression linéaire bayésienne avec une quantité (éventuellement) infinie de fonctions de base. J'essaie actuellement de comprendre cela en détail pour avoir une intuition sur le type de modèles que je peux exprimer en...
J'ai un modèle linéaire généralisé qui adopte une distribution gaussienne et une fonction de liaison logarithmique. Après avoir ajusté le modèle, je vérifie les résidus: tracé QQ, résidus vs valeurs prédites, histogramme des résidus (reconnaissant qu'il faut faire preuve de prudence). Tout a l'air...