Questions marquées «r»

15
Choisir le K optimal pour KNN

J'ai effectué un CV 5 fois pour sélectionner le K optimal pour KNN. Et il semble que plus le K est grand, plus l'erreur est petite ... Désolé je n'avais pas de légende, mais les différentes couleurs représentent différents essais. Il y en a 5 au total et il semble qu'il y ait peu de variation entre...

15
La régression logistique glmnet peut-elle gérer directement les variables factorielles (catégorielles) sans avoir besoin de variables fictives? [fermé]

Fermé. Cette question est hors sujet . Il n'accepte pas actuellement les réponses. Voulez-vous améliorer cette question? Mettez à jour la question afin qu'elle soit sur le sujet pour la validation croisée. Fermé il y a 3 ans . Je construis une régression logistique en R en utilisant la méthode...

15
Comprendre la décomposition QR

J'ai un exemple travaillé (en R), que j'essaie de mieux comprendre. J'utilise Limma pour créer un modèle linéaire et j'essaie de comprendre ce qui se passe pas à pas dans les calculs de changement de pli. J'essaie surtout de comprendre ce qui se passe pour calculer les coefficients. D'après ce que...

15
Un modèle de données non négatives avec agrégation de zéros (Tweedie GLM, zéro gonflé GLM, etc.) peut-il prédire des zéros exacts?

Une distribution de Tweedie peut modéliser des données asymétriques avec une masse ponctuelle à zéro lorsque le paramètre (exposant dans la relation moyenne-variance) est compris entre 1 et 2.ppp De même, un modèle gonflé à zéro (qu'il soit par ailleurs continu ou discret) peut avoir un grand...

15
Si «l'erreur standard» et les «intervalles de confiance» mesurent la précision de la mesure, alors quelles sont les mesures de la précision?

Dans le livre "Biostatistique pour les nuls" à la page 40, je lis: L'erreur standard (abrégée SE) est un moyen d'indiquer la précision de votre estimation ou mesure de quelque chose. et Les intervalles de confiance fournissent une autre façon d'indiquer la précision d'une estimation ou d'une mesure...

15
Régression logistique: Scikit Learn vs glmnet

J'essaie de dupliquer les résultats de sklearnla bibliothèque de régression logistique en utilisant le glmnetpackage dans R. À partir de la documentation desklearn régression logistique , il essaie de minimiser la fonction de coût sous pénalité l2 min w , c 1minw , c12wTw + C∑i = 1NJournal( exp( -...

15
Quelle méthode de comparaison multiple utiliser pour un modèle lmer: lsmeans ou glht?

J'analyse un ensemble de données à l'aide d'un modèle à effets mixtes avec un effet fixe (condition) et deux effets aléatoires (participant en raison de la conception et de la paire du sujet). Le modèle a été généré avec le lme4package:

15
Régression pas à pas dans R - Comment ça marche?

J'essaie de comprendre la différence de base entre la régression pas à pas et la régression vers l'arrière dans R en utilisant la fonction step. Pour la régression pas à pas, j'ai utilisé la commande suivante step(lm(mpg~wt+drat+disp+qsec,data=mtcars),direction="both") J'ai obtenu la sortie...