Quelle est la différence entre les modèles Logit et Probit ? Je suis plus intéressé par savoir quand utiliser la régression logistique et quand utiliser Probit. S'il existe une littérature qui le définit en utilisant R , cela serait également
Quelle est la différence entre les modèles Logit et Probit ? Je suis plus intéressé par savoir quand utiliser la régression logistique et quand utiliser Probit. S'il existe une littérature qui le définit en utilisant R , cela serait également
J'ai lu que "la distance euclidienne n'est pas une bonne distance dans les grandes dimensions". Je suppose que cette déclaration a quelque chose à voir avec la malédiction de la dimensionnalité, mais quoi au juste? En outre, qu'est-ce que les «grandes dimensions»? J'appliquais la classification...
Peut-être que le concept, pourquoi il est utilisé et un
Cherché haut et bas et n'ont pas été en mesure de savoir ce que AUC, en ce qui concerne la prédiction, signifie ou
L'AIC et le BIC sont deux méthodes d'évaluation de l'adéquation du modèle pénalisées pour le nombre de paramètres estimés. Si je comprends bien, BIC pénalise davantage les modèles pour les paramètres libres que l’AIC. Au-delà d'une préférence basée sur la rigueur des critères, existe-t-il d'autres...
J'aimerais implémenter un algorithme pour la sélection automatique de modèles. Je pense faire une régression par étapes, mais tout ira bien (il faut que cela soit basé sur des régressions linéaires). Mon problème est que je suis incapable de trouver une méthodologie, ou une implémentation open...
Si vous avez une variable qui sépare parfaitement les zéros de la variable cible, R affichera le message d’alerte suivant: "séparation parfaite ou quasi parfaite": Warning message: glm.fit: fitted probabilities numerically 0 or 1 occurred Nous obtenons toujours le modèle mais les estimations des...
Je comprends les différences formelles qui les séparent. Ce que je veux savoir, c’est quand il est plus pertinent d’utiliser l’un par rapport à l’autre. Fournissent-ils toujours des informations complémentaires sur les performances d'un système de classification / détection donné? Quand est-il...
Quelle est la différence entre la régression linéaire et la régression logistique? Quand utiliseriez-vous
Certaines hypothèses peuvent être vérifiées à l'aide du test t de Student (peut-être à l'aide de la correction de Welch pour les variances inégales dans le cas à deux échantillons), ou par un test non paramétrique comme le test de Wilcoxon apparié signé, le test de Wilcoxon-Mann-Whitney U, ou le...
Une régression logistique à l'aide de lme4 se termine par Error in mer_finalize(ans) : Downdated X'X is not positive definite. Une cause probable de cette erreur est apparemment une insuffisance de rang. Qu'est-ce qu'une déficience de rang et comment devrais-je y
Lors de la résolution de problèmes métiers à l'aide de données, il est courant qu'au moins une hypothèse clé selon laquelle les statistiques classiques sous-goupilles sont invalides est invalide. La plupart du temps, personne ne se soucie de vérifier ces hypothèses pour ne jamais le savoir. Par...
Bon, je pense donc avoir un échantillon assez décent, en tenant compte de la règle empirique de 20: 1: un échantillon assez volumineux (N = 374) pour un total de 7 variables prédictives candidates. Mon problème est le suivant: quel que soit le jeu de variables de prédiction que j'utilise, les...
Je suis intéressé par le calcul de l'aire sous la courbe (AUC), ou la statistique C, à la main pour un modèle de régression logistique binaire. Par exemple, dans le jeu de données de validation, j'ai la valeur vraie pour la variable dépendante, rétention (1 = retenue; 0 = non conservée), ainsi...
Je commence à me familiariser avec l’utilisation de glmnetavec LASSO Regression, où mon résultat d’intérêt est dichotomique. J'ai créé un petit cadre de données fictif ci-dessous: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99,...
Étant donné que la régression logistique est un statistique modèle de classification prises avec des variables dépendantes, pourquoi pas appelé Classification logistique ? Le nom "Régression" ne devrait-il pas être réservé aux modèles traitant des variables dépendantes...
Pour la régression linéaire, nous pouvons vérifier les tracés de diagnostic (tracés de résidus, tracés QQ normaux, etc.) pour vérifier si les hypothèses de régression linéaire sont violées. Pour la régression logistique, j'ai du mal à trouver des ressources qui expliquent comment diagnostiquer...
Même si toutes les images du jeu de données MNIST sont centrées, avec une échelle similaire et face visible sans rotations, elles présentent une variation importante de l'écriture manuscrite qui me laisse perplexe sur la précision avec laquelle un modèle linéaire atteint une précision de...
Dans son cours d'apprentissage automatique, Andrew Ng introduit la régression linéaire et la régression logistique, et montre comment ajuster les paramètres du modèle à l'aide de la méthode de la méthode de Newton et de la méthode de descente par gradient. Je sais que la descente sur gradient peut...
Dans quels cas doit-on préférer l'un à l'autre? J'ai trouvé quelqu'un qui revendique un avantage pour Kendall, pour des raisons pédagogiques , y a-t-il d'autres