AI: apprentissage vs stratégie

16

J'ai une théorie sur l'IA sur laquelle j'aimerais écrire un "livre blanc". La distinction que je veux explorer en IA est l' apprentissage par rapport à la stratégie. Ma question est, où puis-je lire d'autres documents sur ce sujet?

Permettez-moi de donner un exemple d'échecs. Regardons une IA d'échecs comme un max-arbre, où la capture d'une unité ennemie ajoute la valeur de cette unité au "score de déplacement" pour cette décision (et de même perdre une pièce soustrait cette valeur au score). Capturer un pion peut rapporter 1 point, un chevalier 4 points, une tour 5 points, etc.

La stratégie serait l'IA pour appliquer ces points et déterminer le prochain mouvement; par exemple. étant donné dix coups possibles, choisissez le meilleur (score maximum) à la fin de trois coups.

L'apprentissage consisterait à appliquer l'observation statistique pour déterminer ces valeurs. Si vous jouez 100 parties, l'IA pourrait décider que capturer un pion vaut 2 points, et un chevalier vaut 7 points, tandis qu'une tour ne vaut que 3 points (sur la base de 100 parties).

Cette distinction existe-t-elle déjà dans la littérature, et si oui, où puis-je la lire ?

Edit: Quelqu'un connaît-il un jeu d'échecs (avec de préférence le code source) qui utilise cette approche? Peut-être Chess960 @ Home ?

cendres999
la source
3
Cela ressemble à un mélange de théorie des jeux, avec des «points» ajustés par rapport à l'apprentissage basé sur l'époque.
deceleratedcaviar

Réponses:

15

Ce que vous appelez la stratégie est généralement appelé recherche dans la communauté de l'IA. Il comprend des algorithmes simples comme A * et DFS , et des méthodes de conception heuristique pour des recherches informées comme A *.

Ce que vous appelez d' apprentissage est appelé l' apprentissage machine , traditionnellement divisée en apprentissage supervisé , apprentissage non supervisé , et l' apprentissage de renforcement . Les domaines les plus importants des jeux sont probablement la programmation génétique , les réseaux de neurones et les machines à vecteurs de support , et les réseaux bayésiens . Mais l'apprentissage automatique est un domaine énorme et ce n'est qu'un petit ensemble d'outils qu'il étudie.

Si vous êtes vraiment intéressé par les différents types d'approches de l'IA, je recommande d'obtenir un vrai manuel, comme AI: A Modern Approach plutôt que de lire Wikipedia.


la source
1
+1 pour une approche moderne. Grand livre. Bien que je ne sois pas d'accord avec l'utilité en soi des réseaux de neurones dans les jeux (sauf noir et blanc).
Ray Dey
Je n'ai pas dit qu'elles étaient utiles, juste importantes. Ils ont été utilisés dans plusieurs jeux et de nombreuses techniques d'IA sont basées sur eux ou comparées à eux. Contrairement, disons, aux techniques de clustering de données, que j'utilise incroyablement souvent, mais je ne pense pas avoir vu quelque chose de plus compliqué que les variations de k-means dans les jeux.
C'est assez juste, je conviens que ce sont les domaines les plus applicables aux jeux, ils ont juste besoin d'un peu de travail;)
Ray Dey
Il existe une troisième approche (également appelée «stratégie») appelée Expert Systems, où vous trouverez essentiellement un algorithme basé sur des règles qui peut ne nécessiter aucun arbre de recherche, juste essentiellement une série de if-thens.
Ian Schreiber
1
@Ian: Je connais les systèmes experts, mais ce ne sont pas des séries de if-thens. En fait, les systèmes experts modernes sont mis en œuvre à l'aide des outils que j'ai décrits ci-dessus - on pourrait utiliser l'apprentissage automatique pour aider à évaluer les règles d'inférence possibles, ou rechercher en utilisant le chaînage avant ou arrière à travers ces règles. Vous pensez peut-être aux arbres de décision, mais même ceux-ci sont souvent créés et modifiés par l'apprentissage automatique et explorent plusieurs chemins à l'aide de la recherche.
1

Vous devriez certainement lire AI une approche moderne . Le livre est un peu cher mais vous ne pouvez pas avoir de discussion sérieuse sur l'IA tant que vous n'avez pas de travail de fond. De plus, la 2e édition est aussi bonne que la 3e, donc si vous pouvez trouver une 2e édition moins chère, prenez-la.

Si vous voulez vraiment vous lancer dans l'apprentissage automatique, le livre du Dr Mitchell contient beaucoup d'informations approfondies.

Il est malheureux qu'il y ait une si grande barrière d'entrée dans les universités d'IA. Mais cela n'aidera ni vous ni personne d'autre si vous publiez un livre blanc qui utilise un vocabulaire unique (incorrect) et qui traite de techniques déjà bien connues dans le monde universitaire.

Le domaine de l'apprentissage du comportement de votre adversaire pour améliorer le vôtre a plusieurs entrées notables. De bons filtres anti-spam font exactement cela. Vous devriez regarder dans Paper Rock Scissors AI. Ce qui rend PRS unique, c'est qu'il est simple et qu'il n'y a pas de recherche impliquée (stratégie AKA). La seule façon dont l'IA peut battre un humain est d'apprendre ses préférences et de les exploiter.

Découvrez ce bot PRS AI construit par les NYTimes.

deft_code
la source
Bien, mais pas ce que je recherche. La réponse de Joe Wreschnig est essentiellement ce que je veux - la terminologie de ce que je cherche à rechercher / écrire. De plus, je ne suis pas grand en terminologie et en recherche théorique; Je préfère écrire une bibliothèque réutilisable et la distribuer pour que les gens puissent l'utiliser.
ashes999