Packages de sélection de fonctionnalités dans R, qui effectuent à la fois la régression et la classification

12

Je suis très nouveau à R. J'apprends l'apprentissage automatique en ce moment. Désolé, si cette question semble très basique. J'essaie de trouver un bon package de sélection de fonctionnalités dans R. J'ai parcouru le package Boruta. C'est un bon paquet mais j'ai lu qu'il n'est utile que pour la classification.

Je veux implémenter la sélection de fonctionnalités dans R pour les tâches de régression. J'ai parcouru la documentation du package caret mais pour mon niveau, c'est très difficile à comprendre.

Quelqu'un peut-il me diriger vers un bon didacticiel ou répertorier les bons packages ou les packages les plus fréquemment utilisés dans R pour la sélection des fonctionnalités.

Toute aide serait appréciée. Merci d'avance.

utilisateur1787687
la source
3
Boruta fonctionne bien pour la régression.

Réponses:

13

Vous pouvez également consulter FSelector , varSelRF . FSelector contient plusieurs fonctions pour la sélection de fonctionnalités basées par exemple sur le test du chi carré, sur la théorie de l'information (entropie, information mutuelle, rapport de gain, ...), sur la corrélation entre fonctionnalité, cohérence etc ... varSelRF est un package utile pour la sélection des caractéristiques en utilisant des forêts aléatoires avec élimination variable en arrière et avec un spectre d'importance.

WAF
la source
2
Salut FWaldner, cela semble un peu court pour une réponse. Pourriez-vous envisager de l'étendre peut-être d'une ou deux phrases, peut-être pour mentionner brièvement ce que font ces paquets qui sont semblables ou non aux autres suggestions, ou même peut-être contre d'autres choses? Dans l'état actuel des choses, c'est simplement une paire de liens.
Glen_b -Reinstate Monica
Il semble que varSelRF vise également uniquement la classification des forêts aléatoires plutôt que la régression.
blmoore
7

Avez-vous regardé la vue Tâche CRAN de Machine Learning & Statistical Learning où à côté de caret et Boruta, plusieurs autres packages sont mentionnés?

En général, si vous ne comprenez pas une procédure statistique spécifique concernant la sélection des fonctionnalités, il serait préférable que vous posiez une question ciblée à ce sujet. Le lien CV suivant peut sembler plutôt pratique au départ: Algorithmes de sélection automatique de modèle .

usεr11852
la source
3

Je suggère Rattle qui a une sélection aléatoire de caractéristiques de la forêt (et bien plus encore). Il a une belle interface graphique et très facile à utiliser.

sashkello
la source
1

GLMNET avec régression au lasso ne sélectionne les fonctionnalités.

user100653
la source
1
Pouvez-vous fournir une réponse détaillée?
Apprenti
1

De plus, le Caretpackage fournit également des méthodes de sélection des fonctionnalités. Voici et voici quelques tutoriels sur l'utilisation de la sélection des fonctionnalités dans Caret package. Récemment, un package de sélection de fonctionnalités basé sur l'algorithme SISAL de Tikka et Hollmén est disponible dans le CRAN .

discipulus
la source
Le lien vers le didacticiel est mort. Cependant, ce lien pourrait être utile.
Ekaba Bisong