Questions marquées «game-ai»

20

Comment gérer les mouvements invalides dans l'apprentissage par renforcement?

Je veux créer une IA qui peut jouer à cinq dans une rangée / gomoku. Comme je l'ai mentionné dans le titre, je veux utiliser l'apprentissage par renforcement pour cela. J'utilise la méthode du gradient de politique , à savoir REINFORCE, avec la ligne de base. Pour l'approximation de la valeur et de...

15

Comment choisir le meilleur algorithme pour un jeu de société comme les dames?

Comment choisir le meilleur algorithme pour un jeu de société comme les dames? Jusqu'à présent, je n'ai considéré que trois algorithmes, à savoir le minimax, l'élagage alpha-bêta et la recherche d'arbre Monte Carlo (MCTS). Apparemment, la taille alpha-bêta et les SCTM sont des extensions de...

game-ai minimax alpha-beta-pruning monte-carlo-tree-search

13

Encodage d'entrée / sortie pour un réseau de neurones pour apprendre un jeu basé sur une grille

J'écris un jeu de jouet simple avec l'intention d'entraîner un réseau neuronal profond par-dessus. Les règles du jeu sont à peu près les suivantes: Le jeu a un plateau composé de cellules hexagonales. Les deux joueurs ont la même collection de pièces qu'ils peuvent choisir de positionner librement...

neural-networks deep-learning game-ai

11

Comment former un réseau neuronal pour un jeu de plateau rond?

Je me demande comment former un réseau de neurones pour un jeu de plateau rond, comme le tic-tac-toe, les échecs, le risque ou tout autre jeu basé sur le tour. Obtenir le prochain coup par inférence semble être assez simple, en alimentant l'état du jeu en entrée et en utilisant la sortie comme coup...

training tensorflow game-ai

11

AlphaZero est-il un exemple d'AGI?

Extrait du document de recherche de DeepMind sur arxiv.org: Dans cet article, nous appliquons un algorithme similaire mais entièrement générique, que nous appelons AlphaZero , aux jeux d'échecs et de shogi ainsi qu'à Go, sans aucune connaissance de domaine supplémentaire, à l'exception des règles...

game-ai definitions agi alphago

10

Un réseau de neurones peut-il élaborer le concept de distance?

Imaginez un jeu où c'est un écran noir à part un pixel rouge et un pixel bleu. Étant donné ce jeu à un humain, ils verront d'abord qu'en appuyant sur les touches fléchées, le pixel rouge sera déplacé. La prochaine chose qu'ils essaieront est de déplacer le pixel rouge sur le pixel bleu. Donnez ce...

neural-networks game-ai path-planning teaching-concepts

9

Quelques doutes concernant l'application de l'apprentissage par renforcement à des jeux comme les échecs

J'ai inventé un jeu de société aux échecs. J'ai construit un moteur pour qu'il puisse jouer de manière autonome. Le moteur est essentiellement un arbre de décision. Il est composé de: Une fonction de recherche qui à chaque nœud trouve tous les mouvements légaux possibles Une fonction d'évaluation...

reinforcement-learning game-ai game-theory combinatorial-games negamax

9

La recherche d'arbres de Monte-Carlo peut-elle être considérée comme un apprentissage automatique?

Au meilleur de ma compréhension, l'algorithme de recherche d'arbre Monte Carlo (MCTS) est une alternative à minimax pour rechercher un arbre de nœuds. Cela fonctionne en choisissant un coup (généralement, celui qui a le plus de chances d'être le meilleur), puis en effectuant une lecture aléatoire...

machine-learning reinforcement-learning game-ai monte-carlo-tree-search alphazero