Prédire plusieurs cibles ou classes?

12

Supposons que je construis un modèle prédictif où j'essaie de prédire plusieurs événements (par exemple, le lancer d'un dé et le tirage au sort d'une pièce). La plupart des algorithmes que je connais ne fonctionnent qu'avec une seule cible, alors je me demande s'il existe une approche standard pour ce genre de chose.

Je vois deux options possibles. L'approche la plus naïve serait peut-être de les traiter simplement comme deux problèmes différents, puis de combiner les résultats. Cependant, cela présente de graves inconvénients lorsque les deux cibles ne sont pas indépendantes (et dans de nombreux cas, elles peuvent être très dépendantes).

Une approche plus sensée pour moi serait de créer un attribut cible combiné. Donc, dans le cas d'un dé et d'une pièce, nous aurions états ( ( 1 , H ) , ( 1 , T ) , ( 2 , H ) , etc.). Cependant, cela peut conduire à ce que le nombre d'états / classes dans la cible composite soit assez grand assez rapidement (et si nous avions 2 dés, etc.). En outre, cela semble étrange dans le cas où un attribut est catégorique tandis que l'autre est numérique (par exemple, si l'on prévoit la température et le type de précipitations).62=12(1,H),(1,T),(2,H)

Existe-t-il une approche standard pour ce genre de choses? Sinon, existe-t-il des algorithmes d'apprentissage spécialement conçus pour gérer cela?

Michael McGowan
la source
Voulez-vous dire très dépendant à la fin de votre 2ème paragraphe. Si oui, avez-vous pensé à un type d'approche de la chaîne de Markov une fois la première variable estimée?
Michelle
Oups, je voulais vraiment dire dépendant et je l'ai réparé, merci. Je n'avais pas envisagé une approche de la chaîne de Markov et je devrai penser si cela a du sens ici; Merci.
Michael McGowan

Réponses:

5

Ceci est connu dans la communauté Machine Learning sous le nom de "Multi-Label Learning". Il existe différentes approches du problème, y compris celles que vous décrivez dans votre question. Quelques ressources pour vous aider à démarrer:

tdc
la source
0

Lorsque vous avez deux variables avec les mêmes prédicteurs et que la variable B a également la variable A comme prédicteur, vous envisagez peut-être un problème d'optimisation, où vous souhaitez optimiser les estimations de A et B simultanément. Cela n'a aucun sens d'en optimiser un, si vous obtenez alors une mauvaise estimation pour le second.

Ce serait un problème de recherche opérationnelle, et malheureusement hors de mon domaine d'expertise.

Michelle
la source