Je voudrais connaître les différences entre la régression logistique randomisée (RLR) et la régression logistique simple (LR), par conséquent, je lis un article "Sélection de la stabilité" de Meinshausen, et al. ; cependant je ne comprends pas ce qu'est RLR et quelles sont les différences entre RLR et LR.
Quelqu'un pourrait-il indiquer ce que je dois lire pour comprendre RLR? Ou existe-t-il un exemple simple pour commencer?
machine-learning
logistic
Hendra Bunyamin
la source
la source
Réponses:
Vous voudrez peut-être vérifier cette référence . Sci-kit learn met en œuvre une régression logistique randomisée et la méthode y est décrite.
Mais pour répondre à votre question, les deux méthodes diffèrent largement dans leurs objectifs. La régression logistique consiste à ajuster un modèle et RLR à rechercher les variables qui entrent dans le modèle.
La régression logistique de la vanille est un modèle linéaire généralisé. Pour une réponse binaire, nous supposons que la cote log de la probabilité de réponse est une fonction linéaire d'un certain nombre de prédicteurs. Les coefficients des prédicteurs sont estimés en utilisant le maximum de vraisemblance et l'inférence sur les paramètres est ensuite basée sur de grandes propriétés d'échantillon du modèle. Pour de meilleurs résultats, nous supposons généralement que le modèle est assez simple et bien compris. Nous savons quelles variables indépendantes influent sur la réponse. Nous voulons estimer les paramètres du modèle.
Bien sûr, dans la pratique, nous ne savons pas toujours quelles variables doivent être incluses dans le modèle. Cela est particulièrement vrai dans les situations d'apprentissage automatique où le nombre de variables explicatives potentielles est énorme et leurs valeurs sont rares.
Au fil des ans, de nombreuses personnes ont essayé d'utiliser les techniques d'ajustement des modèles statistiques dans le but de sélectionner des variables (lire "caractéristique"). En augmentant le niveau de fiabilité:
la source