Forêts aléatoires pour la régression multivariée

23

J'ai un problème de régression multi-sorties avec fonctions d'entrée et sorties. Les sorties ont une structure de corrélation complexe et non linéaire.d ydxdy

Je voudrais utiliser des forêts aléatoires pour faire la régression. Pour autant que je sache, les forêts aléatoires pour la régression ne fonctionnent qu'avec une seule sortie, donc je devrais former forêts aléatoires - une pour chaque sortie. Cela ignore leurs corrélations.dy

Existe-t-il une extension aux forêts aléatoires qui prend en compte les corrélations de sortie? Peut-être quelque chose comme la régression du processus gaussien pour l'apprentissage multi-tâches .

sergeyf
la source
4
voici ce que j'ai pu découvrir
sergeyf
1
sûr. j'ai des "images" de haute dimension (en fait des spectres dI / dV) de peptides. l'objectif est de déterminer les emplacements et les classes des acides aminés qui composent le peptide. ma première approche a été la segmentation d'image, mais les CRF et les forêts aléatoires au niveau des pixels ont échoué. alors maintenant, au lieu de dire que chaque pixel "appartient" à un et un seul acide aminé (pas vraiment vrai), j'attribue à chaque pixel une valeur "d'influence" relative des acides aminés voisins. il en résulte un histogramme dimensionnel pour chaque pixel. par conséquent, régression à sorties multiples! dy
sergeyf
1
Ce pourrait être une réponse tardive: dans Crimisini et al. Forêts de décision: un cadre unifié pour la classification, la régression, l'estimation de la densité, l'apprentissage en collecteur, ils utilisent les RF d'une manière qui pourrait vous convenir pour l'identification des limites des organes.
Simone
4
Cela pourrait également être en retard, mais cela pourrait aider quiconque à tomber sur ce message. La forêt aléatoire peut facilement être formée à l'aide de données multivariées. Tout se passe de la même manière, mais au lieu d'utiliser la variance pour le calcul du gain d'informations, nous utilisons la covariance des multiples variables de sortie. Et plus important encore, les feuilles contiennent désormais des PDF à N dimensions.
masad
1
Je ne sais pas que le RF "Cela ignore leurs corrélations". Étant donné la nature d'ensemble de la RF, je pense qu'ils pourraient expliquer les corrélations. S'ils prenaient une entrée univariée et donnaient une sortie univariée, ils ne prendraient pas en compte les corrélations.
EngrStudent

Réponses: