Je suis très nouveau à R. J'apprends l'apprentissage automatique en ce moment. Désolé, si cette question semble très basique. J'essaie de trouver un bon package de sélection de fonctionnalités dans R. J'ai parcouru le package Boruta. C'est un bon paquet mais j'ai lu qu'il n'est utile que pour la classification.
Je veux implémenter la sélection de fonctionnalités dans R pour les tâches de régression. J'ai parcouru la documentation du package caret mais pour mon niveau, c'est très difficile à comprendre.
Quelqu'un peut-il me diriger vers un bon didacticiel ou répertorier les bons packages ou les packages les plus fréquemment utilisés dans R pour la sélection des fonctionnalités.
Toute aide serait appréciée. Merci d'avance.
r
feature-selection
utilisateur1787687
la source
la source
Réponses:
Vous pouvez également consulter FSelector , varSelRF . FSelector contient plusieurs fonctions pour la sélection de fonctionnalités basées par exemple sur le test du chi carré, sur la théorie de l'information (entropie, information mutuelle, rapport de gain, ...), sur la corrélation entre fonctionnalité, cohérence etc ... varSelRF est un package utile pour la sélection des caractéristiques en utilisant des forêts aléatoires avec élimination variable en arrière et avec un spectre d'importance.
la source
Avez-vous regardé la vue Tâche CRAN de Machine Learning & Statistical Learning où à côté de caret et Boruta, plusieurs autres packages sont mentionnés?
En général, si vous ne comprenez pas une procédure statistique spécifique concernant la sélection des fonctionnalités, il serait préférable que vous posiez une question ciblée à ce sujet. Le lien CV suivant peut sembler plutôt pratique au départ: Algorithmes de sélection automatique de modèle .
la source
Je suggère Rattle qui a une sélection aléatoire de caractéristiques de la forêt (et bien plus encore). Il a une belle interface graphique et très facile à utiliser.
la source
GLMNET avec régression au lasso ne sélectionne les fonctionnalités.
la source
De plus, le
Caret
package fournit également des méthodes de sélection des fonctionnalités. Voici et voici quelques tutoriels sur l'utilisation de la sélection des fonctionnalités dansCaret package
. Récemment, un package de sélection de fonctionnalités basé sur l'algorithme SISAL de Tikka et Hollmén est disponible dans le CRAN .la source