Lutte boule de neige KoTH!

35

Résultats (22 mai 2017 21:40:37 UTC)

Mastera gagné 18 rounds, a perdu 2 rounds et à égalité 0 rounds a
Save Onegagné 15 rounds, a perdu 3 rounds et a égalé 2 rounds a
Machine Gungagné 14 rounds, a perdu 3 rounds, et a égalé 3 rounds a
Monte Botgagné 14 rounds, a perdu 3 rounds et a égalé 3 rounds a
Amb Botgagné 12 tours, perdu 8 tours, et attachés 0 tours
Cowardgagnés 11 tours, la perte de 3 tours, et attachés 6 tours
Pain in the Nashgagné 11 tours, a perdu 9 tours, et attachés 0 tours
Nece Botgagnés 10 tours, perdu 7 tours, et attachés 3 tours
Naming Things is Hardgagnés 10 tours, perdu 7 rounds et égalité 3 rounds a
The Procrastinatorgagné 10 rounds, a perdu 8 rounds et égalité 2 rounds a
Yggdrasilgagné 10 rounds, a perdu 10 rounds, et égalité 0 rounds a
Simple Botgagné 9 rounds, a perdu 4 rounds, et a égalé 7 rounds a
Table Botgagné 9 rounds tours et égalité 5 tours a
Prioritized Random Botgagné 8 tours, a perdu 7 tours et égalité 5 tours
Upper Hand Bota gagné 7 rounds, a perdu 13 rounds et a égalé 0 rounds a
Aggressorgagné 6 rounds, a perdu 10 rounds, et a égalé 4 rounds a
Insanegagné 5 rounds, a perdu 15 rounds, et a égalé 0 rounds a
The Ugly Ducklinggagné 4 rounds, a perdu 16 rounds, et a égalé 0 rounds a
Know Botgagné 3 rounds, perdu 14 rounds, et égalité 3 rounds a
Paranoid Botgagné 0 rounds, 19 défaites et 1 match nul
Panic Bot et a égalé 1 round

Malheureusement, je n'ai pas pu tester The Crazy X-Code Randomess car je n'arrive pas à le faire fonctionner à partir de bash sous Linux. Je vais l'inclure si je peux le faire fonctionner.

Sortie complète du contrôleur


Le jeu

Ceci est un jeu KoTH très simple. C'est un combat de boules de neige en tête-à-tête. Vous avez un conteneur initialement vide qui peut contenir des kboules de neige. Vous pouvez esquiver à jcertains moments. À chaque tour, il est demandé aux deux joueurs de donner simultanément le choix du coup à effectuer. Il y a trois mouvements:

  • reload: vous donne une autre boule de neige (jusqu'à k)
  • lancer: lance une boule de neige, qui tuera l'autre joueur s'il décide de recharger. Si les deux joueurs lancent une boule de neige, personne ne meurt (ils ont un si bon but qu'ils vont se toucher les uns les autres)
  • canard: ne fait rien et évite de se faire toucher si l'autre joueur lance une boule de neige. Si vous n'avez plus de canards, rien ne se passe et si l'autre joueur lance une boule de neige, vous mourrez.

Objectif

Ne meurs pas

Challlenge Spécifications

Votre programme peut être écrit dans n'importe quelle langue. Vous devez prendre chacune de ces variables comme argument à chaque exécution:

[turn, snowballs, opponent_snowballs, ducks, opponent_ducks, max_snowballs]

turn- combien de tours se sont écoulés ( 0à la première itération)
snowballs- combien de boules de neige vous avez
opponent_snowballs- combien de boules de neige l'adversaire a
ducks- combien de fois vous pouvez esquiver
opponent_ducks- combien de fois il peut esquiver
max_snowballs- le nombre maximum de boules de neige que vous pouvez magasin ( k)

La sortie de la fonction clé doit être 0pour recharger, 1lancer et 2canard. Vous devez sortir votre mouvement, newline terminé. Veuillez ne pas générer de mouvements non valides, mais le contrôleur est très résistant et ne se cassera pas si vous générez des mouvements non valides (même si votre mouvement n'est même pas un entier). Cependant, il doit être terminé par une nouvelle ligne. Si le coup n'est pas [0, 1, 2]dedans, votre coup par défaut sera0 . Le gagnant sera désigné comme le joueur ayant le plus de victoires dans un tournoi à la ronde complet.

Règles

Vous pouvez lire / écrire depuis / dans un fichier pour le stockage en mémoire entre les itérations. Votre bot sera placé dans son propre répertoire afin d'éviter les conflits de noms de fichiers. Vous ne pouvez pas modifier les fonctions intégrées (telles que le générateur aléatoire). C'était assez amusant la première fois , mais ça ne le sera plus. Votre programme n'est pas autorisé à faire des choses qui ne font que blâmer l'exécution de façon flagrante. Des échappatoires standard s'appliquent .

Essai

Le code source du contrôleur peut être trouvé ici . Exemple d'utilisation: java Controller "python program1/test1.py" "python program2/test2.py" 10 5pour 10 boules de neige et 5 canards.

Juger

Le gagnant sera choisi en sélectionnant la personne ayant le plus de victoires après un tournoi à la ronde complet. Bien que ce soit une égalité, retirez toutes les personnes qui n'ont pas le plus de victoires. Ensuite, répétez jusqu'à ce qu'une personne gagne. La norme de jugement sera de 50 boules de neige et 25 canards.

Heureux KoTHing!

EDIT : La partie sera déclarée à égalité si 1000 tours sont passés. Votre bot peut assumer cela turn < 1000.

HyperNeutrino
la source
Les commentaires ne sont pas pour une discussion prolongée; cette conversation a été déplacée pour discuter .
Dennis
@HyperNeutrino Autres questions: Je pensais que la "norme de jugement" serait 50 boules de neige et 25 canards? Et pourquoi y a-t-il un match nul parfois après ~ 18 tours?
CommonGuy
@ Manu Ehh merde j'ai oublié de changer les paramètres dans mes arguments de VM. Et aussi, c'est parce que s'ils entrent dans une boucle sans fin de collisions en boule de neige, cela se termine après 10 tours de répétition d'une boucle période-1 ou période-2.
HyperNeutrino
1
Alors, y aura-t-il un autre tour? Parce que je veux télécharger mon bot et serais curieux de savoir comment il travaillerait.
erbsenhirn
@erbsenhirn Si vous téléchargez un bot et que vous me envoyez une requête ping sur le chat ou sur le dix-neuvième octet , je lance un autre cycle.
HyperNeutrino

Réponses:

13

Maître, C #

J'ai formé un petit réseau de neurones (en utilisant Sharpneat ). Il semble aimer ramasser des boules de neige et esquiver ...

Dans une version précédente du contrôleur, il avait même trouvé un bogue. Il est passé de 0% à 100% lorsqu'il a découvert comment tromper.

Edit: J'ai oublié de réinitialiser l'état interal des réseaux et j'ai mal formé le réseau. Le réseau nouvellement formé est beaucoup plus petit.

using System;
using System.Collections.Generic;

public class Master
{
    public CyclicNetwork _network;

    public static void Main(string[] args)
    {
        int s = int.Parse(args[1]);
        int os = int.Parse(args[2]);
        int d = int.Parse(args[3]);
        int od = int.Parse(args[4]);
        int ms = int.Parse(args[5]);

        var move = new Master().GetMove(s, os, d, od, ms);
        Console.WriteLine(move);
    }

    public Master()
    {
        var nodes = new List<Neuron>
        {
            new Neuron(0, NodeType.Bias),
            new Neuron(1, NodeType.Input),
            new Neuron(2, NodeType.Input),
            new Neuron(3, NodeType.Input),
            new Neuron(4, NodeType.Input),
            new Neuron(5, NodeType.Input),
            new Neuron(6, NodeType.Output),
            new Neuron(7, NodeType.Output),
            new Neuron(8, NodeType.Output),
            new Neuron(9, NodeType.Hidden)
        };
        var connections = new List<Connection>
        {
            new Connection(nodes[1], nodes[6], -1.3921811701131295),
            new Connection(nodes[6], nodes[6], 0.04683387519679514),
            new Connection(nodes[3], nodes[7], -4.746164930591382),
            new Connection(nodes[8], nodes[8], -0.025484025422054933),
            new Connection(nodes[4], nodes[9], -0.02084856381644095),
            new Connection(nodes[9], nodes[6], 4.9614062853759124),
            new Connection(nodes[9], nodes[9], -0.008672587457112968)
        };
        _network = new CyclicNetwork(nodes, connections, 5, 3, 2);
    }

    public int GetMove(int snowballs, int opponentBalls, int ducks, int opponentDucks, int maxSnowballs)
    {
        _network.InputSignalArray[0] = snowballs;
        _network.InputSignalArray[1] = opponentBalls;
        _network.InputSignalArray[2] = ducks;
        _network.InputSignalArray[3] = opponentDucks;
        _network.InputSignalArray[4] = maxSnowballs;

        _network.Activate();

        double max = double.MinValue;
        int best = 0;
        for (var i = 0; i < _network.OutputCount; i++)
        {
            var current = _network.OutputSignalArray[i];

            if (current > max)
            {
                max = current;
                best = i;
            }
        }

        _network.ResetState();

        return best;
    }
}

public class CyclicNetwork
{
    protected readonly List<Neuron> _neuronList;
    protected readonly List<Connection> _connectionList;
    protected readonly int _inputNeuronCount;
    protected readonly int _outputNeuronCount;
    protected readonly int _inputAndBiasNeuronCount;
    protected readonly int _timestepsPerActivation;
    protected readonly double[] _inputSignalArray;
    protected readonly double[] _outputSignalArray;
    readonly SignalArray _inputSignalArrayWrapper;
    readonly SignalArray _outputSignalArrayWrapper;

    public CyclicNetwork(List<Neuron> neuronList, List<Connection> connectionList, int inputNeuronCount, int outputNeuronCount, int timestepsPerActivation)
    {
        _neuronList = neuronList;
        _connectionList = connectionList;
        _inputNeuronCount = inputNeuronCount;
        _outputNeuronCount = outputNeuronCount;
        _inputAndBiasNeuronCount = inputNeuronCount + 1;
        _timestepsPerActivation = timestepsPerActivation;

        _inputSignalArray = new double[_inputNeuronCount];
        _outputSignalArray = new double[_outputNeuronCount];

        _inputSignalArrayWrapper = new SignalArray(_inputSignalArray, 0, _inputNeuronCount);
        _outputSignalArrayWrapper = new SignalArray(_outputSignalArray, 0, outputNeuronCount);
    }
    public int OutputCount
    {
        get { return _outputNeuronCount; }
    }
    public SignalArray InputSignalArray
    {
        get { return _inputSignalArrayWrapper; }
    }
    public SignalArray OutputSignalArray
    {
        get { return _outputSignalArrayWrapper; }
    }
    public virtual void Activate()
    {
        for (int i = 0; i < _inputNeuronCount; i++)
        {
            _neuronList[i + 1].OutputValue = _inputSignalArray[i];
        }

        int connectionCount = _connectionList.Count;
        int neuronCount = _neuronList.Count;
        for (int i = 0; i < _timestepsPerActivation; i++)
        {
            for (int j = 0; j < connectionCount; j++)
            {
                Connection connection = _connectionList[j];
                connection.OutputValue = connection.SourceNeuron.OutputValue * connection.Weight;
                connection.TargetNeuron.InputValue += connection.OutputValue;
            }
            for (int j = _inputAndBiasNeuronCount; j < neuronCount; j++)
            {
                Neuron neuron = _neuronList[j];
                neuron.OutputValue = neuron.Calculate(neuron.InputValue);
                neuron.InputValue = 0.0;
            }
        }
        for (int i = _inputAndBiasNeuronCount, outputIdx = 0; outputIdx < _outputNeuronCount; i++, outputIdx++)
        {
            _outputSignalArray[outputIdx] = _neuronList[i].OutputValue;
        }
    }
    public virtual void ResetState()
    {
        for (int i = 1; i < _inputAndBiasNeuronCount; i++)
        {
            _neuronList[i].OutputValue = 0.0;
        }
        int count = _neuronList.Count;
        for (int i = _inputAndBiasNeuronCount; i < count; i++)
        {
            _neuronList[i].InputValue = 0.0;
            _neuronList[i].OutputValue = 0.0;
        }
        count = _connectionList.Count;
        for (int i = 0; i < count; i++)
        {
            _connectionList[i].OutputValue = 0.0;
        }
    }
}
public class Connection
{
    readonly Neuron _srcNeuron;
    readonly Neuron _tgtNeuron;
    readonly double _weight;
    double _outputValue;

    public Connection(Neuron srcNeuron, Neuron tgtNeuron, double weight)
    {
        _tgtNeuron = tgtNeuron;
        _srcNeuron = srcNeuron;
        _weight = weight;
    }
    public Neuron SourceNeuron
    {
        get { return _srcNeuron; }
    }
    public Neuron TargetNeuron
    {
        get { return _tgtNeuron; }
    }
    public double Weight
    {
        get { return _weight; }
    }
    public double OutputValue
    {
        get { return _outputValue; }
        set { _outputValue = value; }
    }
}

public class Neuron
{
    readonly uint _id;
    readonly NodeType _neuronType;
    double _inputValue;
    double _outputValue;

    public Neuron(uint id, NodeType neuronType)
    {
        _id = id;
        _neuronType = neuronType;

        // Bias neurons have a fixed output value of 1.0
        _outputValue = (NodeType.Bias == _neuronType) ? 1.0 : 0.0;
    }
    public double InputValue
    {
        get { return _inputValue; }
        set
        {
            if (NodeType.Bias == _neuronType || NodeType.Input == _neuronType)
            {
                throw new Exception("Attempt to set the InputValue of bias or input neuron. Bias neurons have no input, and Input neuron signals should be passed in via their OutputValue property setter.");
            }
            _inputValue = value;
        }
    }
    public double Calculate(double x)
    {
        return 1.0 / (1.0 + Math.Exp(-4.9 * x));
    }
    public double OutputValue
    {
        get { return _outputValue; }
        set
        {
            if (NodeType.Bias == _neuronType)
            {
                throw new Exception("Attempt to set the OutputValue of a bias neuron.");
            }
            _outputValue = value;
        }
    }
}

public class SignalArray
{
    readonly double[] _wrappedArray;
    readonly int _offset;
    readonly int _length;

    public SignalArray(double[] wrappedArray, int offset, int length)
    {
        if (offset + length > wrappedArray.Length)
        {
            throw new Exception("wrappedArray is not long enough to represent the requested SignalArray.");
        }

        _wrappedArray = wrappedArray;
        _offset = offset;
        _length = length;
    }

    public double this[int index]
    {
        get
        {
            return _wrappedArray[_offset + index];
        }
        set
        {
            _wrappedArray[_offset + index] = value;
        }
    }
}

public enum NodeType
{
    /// <summary>
    /// Bias node. Output is fixed to 1.0
    /// </summary>
    Bias,
    /// <summary>
    /// Input node.
    /// </summary>
    Input,
    /// <summary>
    /// Output node.
    /// </summary>
    Output,
    /// <summary>
    /// Hidden node.
    /// </summary>
    Hidden
}
CommonGuy
la source
Apparemment, la réinitialisation de l'état du réseau a considérablement amélioré les performances :)
HyperNeutrino
Contre quoi avez-vous formé le réseau de neurones? Contre d'autres robots postés ici?
JAD
@ JarkoDubbeldam Oui, j'ai porté plusieurs d'entre eux en C # et formé le réseau contre eux. C'est pourquoi il va probablement perdre contre de nouveaux robots.
CommonGuy
Ou simplement former un autre réseau contre les bots et celui-ci: p
JAD
Wat. 8 votes pour un réseau de neurones!
Christopher
6

Économisez un, Python

Lance la plupart de ses boules de neige immédiatement, mais en garde toujours une au cas où l'adversaire guettait un manque de munitions. Ensuite, il évite le plus longtemps possible (encore une fois, en enregistrant 1) avant de recharger sauf s'il existe une garantie de rechargement ou de destruction garantie.

import sys
turn, snowballs, opponent_snowballs, ducks, opponent_ducks, max_snowballs = map(int, sys.argv[1:])

reload_snowball=0
throw=1
duck=2

if snowballs<=1:
    if opponent_snowballs==0:
        if opponent_ducks==0:
            print throw
        else:
            print reload_snowball
    elif ducks > 1:
        print duck
    else:
        print reload_snowball
else:
    print throw
SnoringFrog
la source
2
si vous avez 0 boules de neige, il tentera de lancer 1
Carl Bosch
@CarlBosch que l'état devrait être impossible à atteindre (à part de commencer par 0), mais je vais faire un montage pour couvrir ce cas de toute façon
SnoringFrog
2
@SnoringFrog pour clarifier les règles, vous commencez avec 0 boule de neige
PhiNotPi
@PhiNotPi J'avais complètement oublié cela. Merci pour la clarification
SnoringFrog
6

PrioritizedRandomBot, Java

import java.util.Random;

public class PrioritizedRandomBot implements SnowballFighter {
    static int RELOAD = 0;
    static int THROW = 1;
    static int DUCK = 2;
    static Random rand = new Random();

    public static void main(String[] args) {
        int t = Integer.parseInt(args[0]);
        int s = Integer.parseInt(args[1]);
        int os = Integer.parseInt(args[2]);
        int d = Integer.parseInt(args[3]);
        int od = Integer.parseInt(args[4]);
        int ms = Integer.parseInt(args[5]);
        if (s > os + od) {
            System.out.println(THROW);
            return;
        }
        if (os == 0) {
            if (s == ms || s > 0 && s == od && rand.nextInt(1001 - t) == 0) {
                System.out.println(THROW);
            } else {
                System.out.println(RELOAD);
            }
            return;
        }
        if (os == ms && d > 0) {
            System.out.println(DUCK);
            return;
        }
        int r = rand.nextInt(os + od);
        if (r < s) {
            System.out.println(THROW);
        } else if (r < s + d) {
            System.out.println(DUCK);
        } else {
            System.out.println(RELOAD);
        }
    }
}

Ce bot sélectionne un entier aléatoire dans la plage 0de os + od, puis choisit l'une touche, le canard, ou recharge, avec les seuils déterminés par le nombre actuel de boules de neige et de canards.

Une chose importante à comprendre est qu’une fois qu’un bot a plus de boules de neige que l’autre a boules de neige + canards, vous pouvez forcer la victoire. À partir de là, nous pouvons proposer le concept de "points":

my points = s - os - od
op points = os - s - d

 effects of moves on my points
        OPPONENT
       R    T    D
   R        L   ++
 M T   W          
 E D   -    +    +

Si l'un ou l'autre de ces chiffres devient positif, alors ce joueur est capable de forcer une victoire.

points dif = p - op = 2*(s - os) + d - od

 effects of moves on the difference in points (me - my opponent)
        OPPONENT
       R    T    D
   R        L   +++
 M T   W         -
 E D  ---   +   


points sum = p + op = - (d + od)

 effects of moves on the sum of points (me + my opponent)
        OPPONENT
       R    T    D
   R        L    +
 M T   W         +
 E D   +    +   ++

Le tableau "Différence de points" constitue le fondement de la théorie des jeux pour cette compétition. Il ne capture pas tout à fait toutes les informations, mais il montre comment les boules de neige sont fondamentalement plus utiles que les canards (car les boules de neige sont à la fois une attaque et une défense). Si votre adversaire lance une boule de neige et que vous réussissez à l'éviter, vous êtes sur le point de remporter une victoire forcée, car votre adversaire a utilisé une ressource plus précieuse. Ce tableau décrit également ce que vous devez faire dans de nombreux cas particuliers, par exemple lorsque certaines options de déplacement ne sont pas disponibles.

Le tableau "somme des points" montre comment, avec le temps, la somme des points s'approche de zéro (les deux joueurs étant à court de canards), le premier joueur à faire une erreur (recharger quand ils n'en ont pas besoin) immédiatement perd.

Maintenant, essayons d'étendre cette stratégie de forçage à des cas où elle n'est pas forcée (comme dans, nous gagnons de loin, mais la lecture de l'esprit par l'adversaire nous battra). Fondamentalement, nous avons des sboules de neige mais nous devons faire boule de neige à notre adversaire s+1(ou s+2, etc.) le temps consécutif pour gagner. Dans ce cas, nous voulons soit effectuer quelques canards ou quelques recharges pour gagner du temps.

Pour le moment, ce bot essaie toujours de se faufiler dans certains canards, simplement parce qu’il ne risque donc pas une perte immédiate: nous supposons que l’adversaire suit une stratégie similaire consistant à lober autant de boules de neige qu’il peut. dangereux. En outre, afin d'éviter toute prévisibilité, nous souhaitons les intégrer en suivant une distribution uniformément aléatoire: la probabilité de canardage est liée au nombre de canards à exécuter par rapport au nombre de boules de neige à lancer.

Si nous perdons mal, dans ce cas, s + d < os + odnous devons insérer quelques recharges en plus d'utiliser tous nos canards. Dans ce cas, nous souhaitons recharger au hasard, mais seulement autant de fois que nécessaire.

C'est pourquoi nos robots établissent des priorités dans l'ordre des lancers, des canards et des recharges, et utilisent os + odpour générer le nombre aléatoire, car il s'agit du nombre limite de déplacements que nous devons effectuer.

Le bot gère actuellement un cas d'extrémité et deux autres cas spéciaux. Le cas de bord est lorsque l'adversaire n'a ni boules de neige ni canards, et donc la randomisation ne fonctionne pas, donc nous lançons si possible, sinon nous rechargeons. Un autre cas particulier est lorsque l’adversaire ne peut pas recharger et qu’il n’ya donc aucun avantage à lancer (étant donné que l’adversaire va se baisser ou se jeter), nous évitons toujours (car sauver nos boules de neige a plus de valeur que sauver nos canards). Le dernier cas particulier est celui où l'adversaire n'a pas de boule de neige. Dans ce cas, nous le jouons en toute sécurité et le rechargeons si possible.

PhiNotPi
la source
Cela peut finir par imprimer plusieurs numéros qui risquent de ne pas fonctionner correctement.
HyperNeutrino
@HyperNeutrino J'ai oublié d'ajouter un bloc "else" lorsque j'ai réécrit ce bot en utilisant des instructions return to print.
PhiNotPi
1
@HyperNeutrino Cela a fonctionné pour moi et je l'ai considéré comme une erreur ...
Erik the Outgolfer
Ah Oui, désolé pour avoir bousillé votre code: P Mais bon, premier programme qui utilise le hasard!
HyperNeutrino
6

NeceBot - Python

Voici le tableau de la théorie de jeu pour le jeu:

        OPPONENT
       R    T     D
   R   ~    L   +D+S
 M T   W    ~   +D-S 
 E D -D-S  -D+S   ~

~signifie aucun avantage, Wgagne, Lperd, +-Ssignifie qu'une boule de neige est gagnée / perdue sur l'adversaire et +-Dqu'un canard est gagnée / perdue sur l'adversaire. C'est un jeu complètement symétrique.

Notez que ma solution ne prend pas ce tableau en compte. Parce que je suis mauvais en maths.

import sys

RELOAD = 0
THROW = 1
DUCK = 2

def main(turn, snowballs, opponent_snowballs, ducks, opponent_ducks, max_snowballs):
    if 2 + ducks <3:
        if 2 + snowballs <3:
            return RELOAD
        if 2 + opponent_ducks <3 or 2 + opponent_snowballs <3:
            return THROW
        return RELOAD
    if 2 + snowballs <3:
        if -opponent_snowballs <3 - 5 or 2 + abs(opponent_snowballs - 1) <3:
            return DUCK
        return RELOAD
    if 2 + opponent_ducks <3 or 2 + abs(snowballs - max_snowballs) <3:
        return THROW
    if -snowballs <3 - 6 or turn % 5 <3:
        return THROW
    return DUCK

print(main(*map(int, sys.argv[1:])))

Cela s'appelle le NeceBot parce qu'il essaie de réduire ce qui est nécessaire en premier. Il a ensuite des stratégies arbitraires qui, je l’espère, fonctionneront.

Artyer
la source
4
Whee tant de <3s lol. +1 pour avoir une table de jeu et ne pas l'utiliser: P mais bonne solution :)
HyperNeutrino
3 + opponent_snowballs <3cela pourrait être une erreur?
PhiNotPi
@PhiNotPi Yup. Destiné à être 2. Correction maintenant, merci!
Artyer
Malheureusement, le grand nombre de <3s rend le code assez difficile à comprendre :(
CalculatorFeline
5

Lâche - Scala

Lance, si l'adversaire n'a pas de munitions, sinon (par ordre de priorité) les canards, les lancers ou les recharges.

object Test extends App {
  val s = args(1).toInt
  val os = args(2).toInt
  val d = args(3).toInt

  val move = 
    if(os == 0)
      if(s > 0)
        1
      else
        0
    else if(d > 0)
        2
    else if(s > 0)
      1
    else
      0

  println(move)
}
IchBinKeinBaum
la source
On dirait que ça bloque mon bot ...
Erik the Outgolfer
5

TheUglyDuckling - Python

Esquivera toujours jusqu'à ce qu'il ne puisse plus tenter de lancer si l'adversaire est vide ou de recharger si les deux sont vides. Rechargera en dernier recours.

import sys

arguments = sys.argv;

turn = int(arguments[1])
snowballs = int(arguments[2])
opponent_snowballs = int(arguments[3])
ducks = int(arguments[4])
opponent_ducks = int(arguments[5])
max_snowballs = int(arguments[6])

if ducks > 0:
    print 2
elif opponent_snowballs == 0 and snowballs > 0:
    print 1
elif opponent_snowballs == 0 and snowballs <= 0:
    print 0
elif snowballs > 0:
    print 1
elif snowballs <= 0:
    print 0
Thrax
la source
5

SimpleBot - Python 2

import sys
turn, snowballs, opponent_snowballs, ducks, opponent_ducks, max_snowballs = map(int, sys.argv[1:])

if opponent_snowballs > 0 and ducks > 0: print 2
elif snowballs: print 1
else: print 0

Des trucs simples.

  • Si l'adversaire a des boules de neige et que vous avez des canards, alors vous vous éloignez.
  • Si l'adversaire n'a pas de boule de neige et que vous en avez, vous lancez.
  • Dans les autres cas, vous rechargez.
Erik le golfeur
la source
5

Le bot de nommage-choses-est-difficile - VB.NET

Nommer des choses est difficile, et je ne suis pas sûr d'avoir une stratégie cohérente pour le nommer.

Essaie de jouer les premiers tours pour obtenir une victoire rapide. Après cela, joue le reste du temps en toute sécurité, en essayant de gagner par attrition.

Module SnowballFight

    Private Enum Action
        Reload = 0
        ThrowSnowball = 1
        Duck = 2
    End Enum

    Sub Main(args As String())
        Dim turn As Integer = args(0)
        Dim mySnowballs As Integer = args(1)
        Dim opponentSnowballs As Integer = args(2)
        Dim myDucks As Integer = args(3)
        Dim opponentDucks As Integer = args(4)
        Dim maxSnowballs As Integer = args(5)

        If mySnowballs = 0 AndAlso opponentSnowballs = 0 Then
            ' can't throw, no need to duck
            Console.WriteLine(Action.Reload)
            Exit Sub
        End If

        If turn = 2 AndAlso opponentSnowballs > 0 Then
            ' everyone will probably reload and then throw, so try and duck, and throw turn 3
            Console.WriteLine(Action.Duck)
            Exit Sub
        End If

        If turn = 3 AndAlso opponentSnowballs = 0 Then
            ' they threw on turn 2, get them!
            Console.WriteLine(Action.ThrowSnowball)
            Exit Sub
        End If

        If mySnowballs > 0 AndAlso opponentSnowballs = 0 Then
            ' hope they don't duck
            Console.WriteLine(Action.ThrowSnowball)
            Exit Sub
        End If

        If mySnowballs = 0 AndAlso opponentSnowballs > 0 Then
            If myDucks > 0 Then
                ' watch out!
                Console.WriteLine(Action.Duck)
                Exit Sub
            Else
                ' well, maybe we'll get lucky
                Console.WriteLine(Action.Reload)
                Exit Sub
            End If
        End If

        If opponentSnowballs > 0 AndAlso myDucks > 5 Then
            ' play it safe
            Console.WriteLine(Action.Duck)
            Exit Sub
        End If

        If mySnowballs > 5 OrElse opponentDucks < 5 Then
            ' have a bunch saved up, start throwing them
            Console.WriteLine(Action.ThrowSnowball)
            Exit Sub
        End If

        ' start saving up
        Console.WriteLine(Action.Reload)
    End Sub

End Module
Brian J
la source
5

MachineGun, Python 3

Essaie de sauver les boules de neige jusqu'à ce que soit la garantie de tuer l'adversaire, soit jusqu'à ce que les canards soient épuisés (dans ce cas, il commence à tirer aveuglément toutes ses boules de neige, comme une mitrailleuse)

Il se plie également chaque fois que l'adversaire a une boule de neige, car il ne veut pas mourir.

from os import sys
args = sys.argv[1:]
turn = int(args[0])
snowballs = int(args[1])
opponent_snowballs = int(args[2])
ducks = int(args[3])
opponent_ducks = int(args[4])
max_snowballs = int(args[5])
if ducks > 0 and opponent_snowballs > 0:
    print("2")
elif snowballs > 0 and opponent_snowballs == 0 and opponent_ducks == 0:
    print("1")
elif ducks == 0 and snowballs > 0:
    print("1")
elif snowballs < max_snowballs:
    print("0")
elif snowballs == max_snowballs:
    print("1")
else:
    print("0")
Tron
la source
5

Knowbot, Python3

Garde la fréquence des coups précédents, suppose que l’adversaire fera de nouveau le plus fréquent, se défend contre cela.

** Mise à jour pour ne pas s'attendre à des coups que l'adversaire ne peut pas faire **

import sys,pickle
TURN,BALLS,OTHROWS,DUCKS,ODUCKS,MAXB,OLOADS = [i for i in range(7)]

def save_state(data,prob):
    with open('snowball.pickle', 'wb') as f:
        pickle.dump((data,prob), f)

def load_state():
    with open('snowball.pickle', 'rb') as f:
        return pickle.load(f)

def reload(data = None):
    if not data or data[BALLS]<data[MAXB]:
        print(0)
        return True
    return False

def throw(data):
    if data[BALLS]>0:
        print(1)
        return True
    return False
def duck(data):
    if data[DUCKS]>0:
        print(2)
        return True
    return False


data = [int(v) for v in sys.argv[1:]]
data.append(0)

if data[TURN] > 0:
    last_data,prob = load_state()
    delta = [l-n for l,n in zip(last_data, data)]
    if delta[OTHROWS]<0:
        delta[OTHROWS]=0
        delta[OLOADS]=1
    prob = [p+d for p,d in zip(prob,delta)]
else:
    prob = [0]*7

expected = sorted(((prob[action],action) for action in [OTHROWS, ODUCKS, OLOADS]),
                      reverse=True)
expect = next( (a for p,a in expected if data[a]>0), OLOADS)

if expect == OTHROWS:
    duck(data) or throw(data) or reload()
elif expect == ODUCKS:
    reload(data) or duck(data) or throw(data) or reload()
else:
    throw(data) or reload(data) or duck(data) or reload()

save_state(data,prob);
AShelly
la source
Je ne sais pas exactement comment cela fonctionne, mais s'il stocke des données entre des tours (par opposition à des tours), malheureusement, toutes les données sont supprimées entre les tours. Cela n'invalide pas votre solution, mais gardez cela à l'esprit :)
HyperNeutrino
On ne s'attend pas à conserver les données entre les tours, mais à s'attendre à ce que l'adversaire actuel soit cohérent.
AShelly
Bien. D'accord. Je voulais juste m'assurer qu'il n'y avait pas d'idées fausses. :)
HyperNeutrino
4

Braingolf , l'agresseur

<<?1:0

L'agresseur n'est pas un lâche! S'il a une boule de neige, il doit lancer! S'il n'a pas de boule de neige, il en fera plus!

Braingolf , le fou

Ce n’est pas vraiment un bot, c’est juste un programmeur que j’ai kidnappé et obligé de transférer chaque projet qu’il a réalisé jusqu’à braingolf. Il n'a plus un soupçon de santé mentale.

<3r!?:1+|%

Génère un nombre aléatoire inférieur à 3 et génère des sorties t % r où t est le tour actuel et r le nombre aléatoire

Pour les exécuter, vous devez télécharger à braingolf.pypartir de github, puis sauvegarder le code braingolf dans un fichier et exécuter

python3 braingolf.py -f filename <space separated inputs>

ou insérez simplement le code directement comme ceci

python3 braingolf.py -c '<<?1:0' <space separated inputs>

Les entrées sont assez peu importantes tant que le deuxième argument après le code / nom de fichier correspond à la quantité de boules de neige dont dispose Aggressor.

Note: L’agresseur se comporte de manière identique au TestBot, je voulais juste faire une entrée dans braingolf

Braingolf , The Brainy [Cassé en ce moment]

VR<<<!?v1:v0|R>!?v1:v0|>R<<!?v1:v0|>R<!?v1:v0|<VR<<.m<.m~v<-?~v0:~v1|>vc
VRv.<.>+1-?2_;|>.M<v?:0_;|1
Skidsdev
la source
Bien sûr, quelqu'un devait le faire: D Nice et même jouer au golf! : D
HyperNeutrino
Oh, attends, c’est pareil que le mien, sauf gofier. lol
HyperNeutrino
@HyperNeutrino Yup, je suis gunna travailler sur un vrai dans une langue réelle maintenant. J'utiliserais Braingolf pour un vrai, mais ça ne peut pas faire de conditionnel imbriqué, donc ça rend les choses difficiles
Skidsdev
2
Je pense que vous devriez poster "The Brainy" comme réponse séparée. Aussi, je pense que cela se trompe.
Erik l'Outgolfer
"The Insane" n'est pas un bot stable, donc je ne sais pas comment @HyperNeutrino le vérifierait.
Erik the Outgolfer
3

TestBot - Python

Ceci est une soumission test pour vous montrer à quoi peut ressembler une soumission valide. La stratégie: alterner le rechargement et le lancement. C'est une mauvaise stratégie, mais cela vous donne une idée de la façon dont votre programme devrait fonctionner.

from os import sys
arguments = sys.argv;
turn = int(arguments[1])
print(turn % 2)
HyperNeutrino
la source
Serait _, turn, snowballs, opponent_snowballs, ducks, opponent_ducks, max_snowballs = sys.argvles arguments?
Artyer
@Artyer Oui. Il se trouve que le premier argument a le nom de fichier.
HyperNeutrino
Vous pouvez simplement utiliser sys.argv[1:]si vous ne voulez pas jouer avec ça_
sagiksp
2

UpperHandBot, Python 3

import sys
turn, snowballs, opponent_snowballs, ducks, opponent_ducks, max_snowballs = map(int, sys.argv[1:])

if snowballs <= opponent_snowballs:
  if opponent_snowballs > 0 and ducks > 0:
    print(2)
  else:
    if snowballs < max_snowballs:
      print(0)
    else:
      print(1)
else:
  print(1)

Ce bot tente de collecter plus de boules de neige que son adversaire et commence à lancer. Si UHB n'a pas plus de boules de neige que son adversaire, il:

  • Canard, si l'adversaire a des boules de neige et qu'il reste des canards
  • Sinon, rechargez (sauf si UHB est au maximum, alors il jette à la place, bien que je ne pense pas que cette situation se reproduirait un jour)
Chat d'affaires
la source
2

Yggdrasli, Java

import java.util.HashMap;
import java.util.Map;
import java.util.Random;

public class Yggdrasil implements SnowballFighter {
    public static boolean debug = false;
    static int RELOAD = 0;
    static int THROW = 1;
    static int DUCK = 2;
    static int INVALID = -3;
    static Random rand = new Random();

    public static void main(String[] args) {
        int t = Integer.parseInt(args[0]);
        int s = Integer.parseInt(args[1]);
        int os = Integer.parseInt(args[2]);
        int d = Integer.parseInt(args[3]);
        int od = Integer.parseInt(args[4]);
        int ms = Integer.parseInt(args[5]);
        System.out.println((new Yggdrasil()).move(t, s, os, d, od, ms));
    }

    public final int move(int t, int s, int os, int d, int od, int ms) {
        State state = State.get(s, os, d, od);
        double val = state.val(4);
        double[] strat = state.strat;
        int move = INVALID;
        if (debug) {
            System.out.println(val + " : " + strat[0] + " " + strat[1] + " " + strat[2]);
        }
        while (move == INVALID) {
            double r = rand.nextDouble();
            if (r < strat[RELOAD] && strat[RELOAD] > 0.0001) {
                move = RELOAD;
            } else if (r < strat[RELOAD] + strat[THROW] && strat[THROW] > 0.0001) {
                move = THROW;
            } else if (r < strat[RELOAD] + strat[THROW] + strat[DUCK] && strat[DUCK] > 0.0001) {
                move = DUCK;
            }
        }
        return move;
    }

    public static class State {

        public static boolean debug = false;
        public static int ms = 50;
        public int s;
        public int os;
        public static int md = 25;
        public int d;
        public int od;

        public State(int s, int os, int d, int od) {
            super();
            this.s = s;
            this.os = os;
            this.d = d;
            this.od = od;
        }

        Double val;
        int valdepth;
        double[] strat = new double[3];

        public Double val(int maxdepth) {
            if (s < 0 || s > ms || d < 0 || d > md || os < 0 || os > ms || od < 0 || od > md) {
                return null;
            } else if (val != null && valdepth >= maxdepth) {
                return val;
            }
            if (s > os + od) {
                val = 1.0; // force win
                strat = new double[] { 0, 1, 0 };
            } else if (os > s + d) {
                val = -1.0; // force loss
                strat = new double[] { 1.0 / (1.0 + s + d), s / (1.0 + s + d), d / (1.0 + s + d) };
            } else if (d == 0 && od == 0) {
                val = 0.0; // perfect tie
                if (s > 0) {
                    strat = new double[] { 0, 1, 0 };
                } else {
                    strat = new double[] { 1, 0, 0 };
                }
            } else if (maxdepth <= 0) {
                double togo = 1 - s + os + od;
                double otogo = 1 - os + s + d;
                double per = otogo * otogo / (togo * togo + otogo * otogo);
                double oper = togo * togo / (togo * togo + otogo * otogo);
                val = per - oper;
            } else {
                Double[][] fullmatrix = new Double[3][3];
                boolean[] vm = new boolean[3];
                boolean[] ovm = new boolean[3];
                for (int i = 0; i < 3; i++) {
                    int dest_s = s;
                    int dest_d = d;
                    if (i == 0) {
                        dest_s++;
                    } else if (i == 1) {
                        dest_s--;
                    } else {
                        dest_d--;
                    }
                    for (int j = 0; j < 3; j++) {
                        int dest_os = os;
                        int dest_od = od;
                        if (j == 0) {
                            dest_os++;
                        } else if (j == 1) {
                            dest_os--;
                        } else {
                            dest_od--;
                        }
                        if (i == 0 && j == 1 && dest_os >= 0 && dest_s <= ms) {
                            fullmatrix[i][j] = -1.0; // kill
                        } else if (i == 1 && j == 0 && dest_s >= 0 && dest_os <= ms) {
                            fullmatrix[i][j] = 1.0; // kill
                        } else {
                            fullmatrix[i][j] = get(dest_s, dest_os, dest_d, dest_od).val(maxdepth - 1);
                        }
                        if (fullmatrix[i][j] != null) {
                            vm[i] = true;
                            ovm[j] = true;
                        }
                    }
                }

                if (debug) {
                    System.out.println();
                    System.out.println(maxdepth);
                    System.out.println(s + " " + os + " " + d + " " + od);
                    for (int i = 0; i < 3; i++) {
                        System.out.print(vm[i]);
                    }
                    System.out.println();
                    for (int i = 0; i < 3; i++) {
                        System.out.print(ovm[i]);
                    }
                    System.out.println();
                    for (int i = 0; i < 3; i++) {
                        for (int j = 0; j < 3; j++) {
                            System.out.printf(" %7.4f", fullmatrix[i][j]);
                        }
                        System.out.println();
                    }
                }
                // really stupid way to find an approximate best strategy
                val = -1.0;
                double[] p = new double[3];
                for (p[0] = 0; p[0] < 0.0001 || vm[0] && p[0] <= 1.0001; p[0] += 0.01) {
                    for (p[1] = 0; p[1] < 0.0001 || vm[1] && p[1] <= 1.0001 - p[0]; p[1] += 0.01) {
                        p[2] = 1.0 - p[0] - p[1];
                        if (p[2] < 0.0001 || vm[2]) {
                            double min = 1;
                            for (int j = 0; j < 3; j++) {
                                if (ovm[j]) {
                                    double sum = 0;
                                    for (int i = 0; i < 3; i++) {
                                        if (vm[i]) {
                                            sum += fullmatrix[i][j] * p[i];
                                        }
                                    }
                                    min = Math.min(min, sum);
                                }
                            }
                            if (min > val) {
                                val = min;
                                strat = p.clone();
                            }
                        }
                    }
                }
                if (debug) {
                    System.out.println("v:" + val);
                    System.out.println("s:" + strat[0] + " " + strat[1] + " " + strat[2]);
                }
            }
            valdepth = maxdepth;
            return val;
        }

        static Map<Integer, State> cache = new HashMap<Integer, State>();

        static State get(int s, int os, int d, int od) {
            int key = (((s) * 100 + os) * 100 + d) * 100 + od;
            if (cache.containsKey(key)) {
                return cache.get(key);
            }
            State res = new State(s, os, d, od);
            cache.put(key, res);
            return res;
        }
    }
}

J'ai nommé ce bot "Yggdrasil" parce qu'il regarde en avant dans l'arbre du jeu et effectue une évaluation de l'état, à partir duquel il peut calculer une stratégie mixte approximativement idéale. Parce qu'il repose sur des stratégies mixtes, il est très non déterministe. Je ne sais pas si cela va bien se passer en compétition réelle.

Quelques choses à propos de ce bot:

  • Le noyau est une fonction récursive qui calcule la valeur et la stratégie mixte presque idéale pour tout état de jeu particulier. À l'heure actuelle, je suis prêt à regarder 4 étapes à venir.
  • Il est extrêmement attrayant, car dans de nombreux cas, ce bot équivaut à "choisir un mouvement aléatoire dans des ciseaux de papier-pierre". Il se maintient et espère que son adversaire lui donnera un avantage statistique. Si ce bot était parfait (ce qui n’est pas le cas), le mieux que vous puissiez faire contre ce serait 50% de victoires et 50% de pertes. En conséquence, il n’ya pas d’adversaire qui soit battu de façon constante, mais il n’ya également aucun adversaire qu’il perd systématiquement.
PhiNotPi
la source
Je ne comprends toujours pas le nom ...: P
HyperNeutrino
@HyperNeutrino Yggdrasil est un arbre mythologique, et dans ce cas je fais référence à l'arbre de jeu.
PhiNotPi
Ohhhh oui j'ai l'impression que j'aurais dû m'en souvenir. : P Nice!
HyperNeutrino
2

Douleur dans le Nash (C ++)

Ainsi appelé parce que le fait que je devais écrire mon propre solveur d'équilibre de Nash était une vraie douleur. Je suis surpris qu'il n'y ait pas de bibliothèques de résolution de Nash facilement disponibles!

#include <fstream>
#include <iostream>
#include <vector>
#include <array>
#include <random>
#include <utility>

typedef double NumT;
static const NumT EPSILON = 1e-5;

struct Index {
    int me;
    int them;

    Index(int me, int them) : me(me), them(them) {}
};

struct Value {
    NumT me;
    NumT them;

    Value(void) : me(0), them(0) {}

    Value(NumT me, NumT them) : me(me), them(them) {}
};

template <int subDimMe, int subDimThem>
struct Game {
    const std::array<NumT, 9> *valuesMe;
    const std::array<NumT, 9> *valuesThemT;

    std::array<int, subDimMe> coordsMe;
    std::array<int, subDimThem> coordsThem;

    Game(
        const std::array<NumT, 9> *valuesMe,
        const std::array<NumT, 9> *valuesThemT
    )
        : valuesMe(valuesMe)
        , valuesThemT(valuesThemT)
        , coordsMe{}
        , coordsThem{}
    {}

    Index baseIndex(Index i) const {
        return Index(coordsMe[i.me], coordsThem[i.them]);
    }

    Value at(Index i) const {
        Index i2 = baseIndex(i);
        return Value(
            (*valuesMe)[i2.me * 3 + i2.them],
            (*valuesThemT)[i2.me + i2.them * 3]
        );
    }

    Game<2, 2> subgame22(int me0, int me1, int them0, int them1) const {
        Game<2, 2> b(valuesMe, valuesThemT);
        b.coordsMe[0] = coordsMe[me0];
        b.coordsMe[1] = coordsMe[me1];
        b.coordsThem[0] = coordsThem[them0];
        b.coordsThem[1] = coordsThem[them1];
        return b;
    }
};

struct Strategy {
    std::array<NumT, 3> probMe;
    std::array<NumT, 3> probThem;
    Value expectedValue;
    bool valid;

    Strategy(void)
        : probMe{}
        , probThem{}
        , expectedValue()
        , valid(false)
    {}

    void findBestMe(const Strategy &b) {
        if(b.valid && (!valid || b.expectedValue.me > expectedValue.me)) {
            *this = b;
        }
    }
};

template <int dimMe, int dimThem>
Strategy nash_pure(const Game<dimMe, dimThem> &g) {
    Strategy s;
    int choiceMe = -1;
    int choiceThem = 0;
    for(int me = 0; me < dimMe; ++ me) {
        for(int them = 0; them < dimThem; ++ them) {
            const Value &v = g.at(Index(me, them));
            bool valid = true;
            for(int me2 = 0; me2 < dimMe; ++ me2) {
                if(g.at(Index(me2, them)).me > v.me) {
                    valid = false;
                }
            }
            for(int them2 = 0; them2 < dimThem; ++ them2) {
                if(g.at(Index(me, them2)).them > v.them) {
                    valid = false;
                }
            }
            if(valid) {
                if(choiceMe == -1 || v.me > s.expectedValue.me) {
                    s.expectedValue = v;
                    choiceMe = me;
                    choiceThem = them;
                }
            }
        }
    }
    if(choiceMe != -1) {
        Index iBase = g.baseIndex(Index(choiceMe, choiceThem));
        s.probMe[iBase.me] = 1;
        s.probThem[iBase.them] = 1;
        s.valid = true;
    }
    return s;
}

Strategy nash_mixed(const Game<2, 2> &g) {
    //    P    Q
    // p a A  b B
    // q c C  d D

    Value A = g.at(Index(0, 0));
    Value B = g.at(Index(0, 1));
    Value C = g.at(Index(1, 0));
    Value D = g.at(Index(1, 1));

    // q = 1-p, Q = 1-P
    // Pick p such that choice of P,Q is arbitrary

    // p*A+(1-p)*C = p*B+(1-p)*D
    // p*A+C-p*C = p*B+D-p*D
    // p*(A+D-B-C) = D-C
    // p = (D-C) / (A+D-B-C)

    NumT p = (D.them - C.them) / (A.them + D.them - B.them - C.them);

    // P*a+(1-P)*b = P*c+(1-P)*d
    // P*a+b-P*b = P*c+d-P*d
    // P*(a+d-b-c) = d-b
    // P = (d-b) / (a+d-b-c)

    NumT P = (D.me - B.me) / (A.me + D.me - B.me - C.me);

    Strategy s;
    if(p >= -EPSILON && p <= 1 + EPSILON && P >= -EPSILON && P <= 1 + EPSILON) {
        if(p <= 0) {
            p = 0;
        } else if(p >= 1) {
            p = 1;
        }
        if(P <= 0) {
            P = 0;
        } else if(P >= 1) {
            P = 1;
        }
        Index iBase0 = g.baseIndex(Index(0, 0));
        Index iBase1 = g.baseIndex(Index(1, 1));
        s.probMe[iBase0.me] = p;
        s.probMe[iBase1.me] = 1 - p;
        s.probThem[iBase0.them] = P;
        s.probThem[iBase1.them] = 1 - P;
        s.expectedValue = Value(
            P * A.me + (1 - P) * B.me,
            p * A.them + (1 - p) * C.them
        );
        s.valid = true;
    }
    return s;
}

Strategy nash_mixed(const Game<3, 3> &g) {
    //    P    Q    R
    // p a A  b B  c C
    // q d D  e E  f F
    // r g G  h H  i I

    Value A = g.at(Index(0, 0));
    Value B = g.at(Index(0, 1));
    Value C = g.at(Index(0, 2));
    Value D = g.at(Index(1, 0));
    Value E = g.at(Index(1, 1));
    Value F = g.at(Index(1, 2));
    Value G = g.at(Index(2, 0));
    Value H = g.at(Index(2, 1));
    Value I = g.at(Index(2, 2));

    // r = 1-p-q, R = 1-P-Q
    // Pick p,q such that choice of P,Q,R is arbitrary

    NumT q = ((
        + A.them * (I.them-H.them)
        + G.them * (B.them-C.them)
        - B.them*I.them
        + H.them*C.them
    ) / (
        (G.them+E.them-D.them-H.them) * (B.them+I.them-H.them-C.them) -
        (H.them+F.them-E.them-I.them) * (A.them+H.them-G.them-B.them)
    ));

    NumT p = (
        ((G.them+E.them-D.them-H.them) * q + (H.them-G.them)) /
        (A.them+H.them-G.them-B.them)
    );

    NumT Q = ((
        + A.me * (I.me-F.me)
        + C.me * (D.me-G.me)
        - D.me*I.me
        + F.me*G.me
    ) / (
        (C.me+E.me-B.me-F.me) * (D.me+I.me-F.me-G.me) -
        (F.me+H.me-E.me-I.me) * (A.me+F.me-C.me-D.me)
    ));

    NumT P = (
        ((C.me+E.me-B.me-F.me) * Q + (F.me-C.me)) /
        (A.me+F.me-C.me-D.me)
    );

    Strategy s;
    if(
        p >= -EPSILON && q >= -EPSILON && p + q <= 1 + EPSILON &&
        P >= -EPSILON && Q >= -EPSILON && P + Q <= 1 + EPSILON
    ) {
        if(p <= 0) { p = 0; }
        if(q <= 0) { q = 0; }
        if(P <= 0) { P = 0; }
        if(Q <= 0) { Q = 0; }
        if(p + q >= 1) {
            if(p > q) {
                p = 1 - q;
            } else {
                q = 1 - p;
            }
        }
        if(P + Q >= 1) {
            if(P > Q) {
                P = 1 - Q;
            } else {
                Q = 1 - P;
            }
        }
        Index iBase0 = g.baseIndex(Index(0, 0));
        s.probMe[iBase0.me] = p;
        s.probThem[iBase0.them] = P;
        Index iBase1 = g.baseIndex(Index(1, 1));
        s.probMe[iBase1.me] = q;
        s.probThem[iBase1.them] = Q;
        Index iBase2 = g.baseIndex(Index(2, 2));
        s.probMe[iBase2.me] = 1 - p - q;
        s.probThem[iBase2.them] = 1 - P - Q;
        s.expectedValue = Value(
            A.me * P + B.me * Q + C.me * (1 - P - Q),
            A.them * p + D.them * q + G.them * (1 - p - q)
        );
        s.valid = true;
    }
    return s;
}

template <int dimMe, int dimThem>
Strategy nash_validate(Strategy &&s, const Game<dimMe, dimThem> &g, Index unused) {
    if(!s.valid) {
        return s;
    }

    NumT exp;

    exp = 0;
    for(int them = 0; them < dimThem; ++ them) {
        exp += s.probThem[them] * g.at(Index(unused.me, them)).me;
    }
    if(exp > s.expectedValue.me) {
        s.valid = false;
        return s;
    }

    exp = 0;
    for(int me = 0; me < dimMe; ++ me) {
        exp += s.probMe[me] * g.at(Index(me, unused.them)).them;
    }
    if(exp > s.expectedValue.them) {
        s.valid = false;
        return s;
    }

    return s;
}

Strategy nash(const Game<2, 2> &g, bool verbose) {
    Strategy s = nash_mixed(g);
    s.findBestMe(nash_pure(g));
    if(!s.valid && verbose) {
        std::cerr << "No nash equilibrium found!" << std::endl;
    }
    return s;
}

Strategy nash(const Game<3, 3> &g, bool verbose) {
    Strategy s = nash_mixed(g);
    s.findBestMe(nash_validate(nash_mixed(g.subgame22(1, 2,  1, 2)), g, Index(0, 0)));
    s.findBestMe(nash_validate(nash_mixed(g.subgame22(1, 2,  0, 2)), g, Index(0, 1)));
    s.findBestMe(nash_validate(nash_mixed(g.subgame22(1, 2,  0, 1)), g, Index(0, 2)));
    s.findBestMe(nash_validate(nash_mixed(g.subgame22(0, 2,  1, 2)), g, Index(1, 0)));
    s.findBestMe(nash_validate(nash_mixed(g.subgame22(0, 2,  0, 2)), g, Index(1, 1)));
    s.findBestMe(nash_validate(nash_mixed(g.subgame22(0, 2,  0, 1)), g, Index(1, 2)));
    s.findBestMe(nash_validate(nash_mixed(g.subgame22(0, 1,  1, 2)), g, Index(2, 0)));
    s.findBestMe(nash_validate(nash_mixed(g.subgame22(0, 1,  0, 2)), g, Index(2, 1)));
    s.findBestMe(nash_validate(nash_mixed(g.subgame22(0, 1,  0, 1)), g, Index(2, 2)));
    s.findBestMe(nash_pure(g));
    if(!s.valid && verbose) {
        // theory says this should never happen, but fp precision makes it possible
        std::cerr << "No nash equilibrium found!" << std::endl;
    }
    return s;
}

struct PlayerState {
    int balls;
    int ducks;

    PlayerState(int balls, int ducks) : balls(balls), ducks(ducks) {}

    PlayerState doReload(int maxBalls) const {
        return PlayerState(std::min(balls + 1, maxBalls), ducks);
    }

    PlayerState doThrow(void) const {
        return PlayerState(std::max(balls - 1, 0), ducks);
    }

    PlayerState doDuck(void) const {
        return PlayerState(balls, std::max(ducks - 1, 0));
    }

    std::array<double,3> flail(int maxBalls) const {
        // opponent has obvious win;
        // try stuff at random and hope the opponent is bad

        (void) ducks;

        int options = 0;
        if(balls > 0) {
            ++ options;
        }
        if(balls < maxBalls) {
            ++ options;
        }
        if(ducks > 0) {
            ++ options;
        }

        std::array<double,3> p{};
        if(balls < balls) {
            p[0] = 1.0f / options;
        }
        if(balls > 0) {
            p[1] = 1.0f / options;
        }
        return p;
    }
};

class GameStore {
protected:
    const int balls;
    const int ducks;
    const std::size_t playerStates;
    const std::size_t gameStates;

public:
    static std::string filename(int turn) {
        return "nashdata_" + std::to_string(turn) + ".dat";
    }

    GameStore(int maxBalls, int maxDucks)
        : balls(maxBalls)
        , ducks(maxDucks)
        , playerStates((balls + 1) * (ducks + 1))
        , gameStates(playerStates * playerStates)
    {}

    std::size_t playerIndex(const PlayerState &p) const {
        return p.balls * (ducks + 1) + p.ducks;
    }

    std::size_t gameIndex(const PlayerState &me, const PlayerState &them) const {
        return playerIndex(me) * playerStates + playerIndex(them);
    }

    std::size_t fileIndex(const PlayerState &me, const PlayerState &them) const {
        return 2 + gameIndex(me, them) * 2;
    }

    PlayerState stateFromPlayerIndex(std::size_t i) const {
        return PlayerState(i / (ducks + 1), i % (ducks + 1));
    }

    std::pair<PlayerState, PlayerState> stateFromGameIndex(std::size_t i) const {
        return std::make_pair(
            stateFromPlayerIndex(i / playerStates),
            stateFromPlayerIndex(i % playerStates)
        );
    }

    std::pair<PlayerState, PlayerState> stateFromFileIndex(std::size_t i) const {
        return stateFromGameIndex((i - 2) / 2);
    }
};

class Generator : public GameStore {
    static char toDat(NumT v) {
        int iv = int(v * 256.0);
        return char(std::max(std::min(iv, 255), 0));
    }

    std::vector<Value> next;

public:
    Generator(int maxBalls, int maxDucks)
        : GameStore(maxBalls, maxDucks)
        , next()
    {}

    const Value &nextGame(const PlayerState &me, const PlayerState &them) const {
        return next[gameIndex(me, them)];
    }

    void make_probabilities(
        std::array<NumT, 9> &g,
        const PlayerState &me,
        const PlayerState &them
    ) const {
        const int RELOAD = 0;
        const int THROW = 1;
        const int DUCK = 2;

        g[RELOAD * 3 + RELOAD] =
            nextGame(me.doReload(balls), them.doReload(balls)).me;

        g[RELOAD * 3 + THROW] =
            (them.balls > 0) ? -1
            : nextGame(me.doReload(balls), them.doThrow()).me;

        g[RELOAD * 3 + DUCK] =
            nextGame(me.doReload(balls), them.doDuck()).me;

        g[THROW * 3 + RELOAD] =
            (me.balls > 0) ? 1
            : nextGame(me.doThrow(), them.doReload(balls)).me;

        g[THROW * 3 + THROW] =
            ((me.balls > 0) == (them.balls > 0))
            ? nextGame(me.doThrow(), them.doThrow()).me
            : (me.balls > 0) ? 1 : -1;

        g[THROW * 3 + DUCK] =
            (me.balls > 0 && them.ducks == 0) ? 1
            : nextGame(me.doThrow(), them.doDuck()).me;

        g[DUCK * 3 + RELOAD] =
            nextGame(me.doDuck(), them.doReload(balls)).me;

        g[DUCK * 3 + THROW] =
            (them.balls > 0 && me.ducks == 0) ? -1
            : nextGame(me.doDuck(), them.doThrow()).me;

        g[DUCK * 3 + DUCK] =
            nextGame(me.doDuck(), them.doDuck()).me;
    }

    Game<3, 3> make_game(const PlayerState &me, const PlayerState &them) const {
        static std::array<NumT, 9> globalValuesMe;
        static std::array<NumT, 9> globalValuesThemT;
        #pragma omp threadprivate(globalValuesMe)
        #pragma omp threadprivate(globalValuesThemT)

        make_probabilities(globalValuesMe, me, them);
        make_probabilities(globalValuesThemT, them, me);
        Game<3, 3> g(&globalValuesMe, &globalValuesThemT);
        for(int i = 0; i < 3; ++ i) {
            g.coordsMe[i] = i;
            g.coordsThem[i] = i;
        }
        return g;
    }

    Strategy solve(const PlayerState &me, const PlayerState &them, bool verbose) const {
        if(me.balls > them.balls + them.ducks) { // obvious answer
            Strategy s;
            s.probMe[1] = 1;
            s.probThem = them.flail(balls);
            s.expectedValue = Value(1, -1);
            return s;
        } else if(them.balls > me.balls + me.ducks) { // uh-oh
            Strategy s;
            s.probThem[1] = 1;
            s.probMe = me.flail(balls);
            s.expectedValue = Value(-1, 1);
            return s;
        } else if(me.balls == 0 && them.balls == 0) { // obvious answer
            Strategy s;
            s.probMe[0] = 1;
            s.probThem[0] = 1;
            s.expectedValue = nextGame(me.doReload(balls), them.doReload(balls));
            return s;
        } else {
            return nash(make_game(me, them), verbose);
        }
    }

    void generate(int turns, bool saveAll, bool verbose) {
        next.clear();
        next.resize(gameStates);
        std::vector<Value> current(gameStates);
        std::vector<char> data(2 + gameStates * 2);

        for(std::size_t turn = turns; (turn --) > 0;) {
            if(verbose) {
                std::cerr << "Generating for turn " << turn << "..." << std::endl;
            }
            NumT maxDiff = 0;
            NumT msd = 0;
            data[0] = balls;
            data[1] = ducks;
            #pragma omp parallel for reduction(+:msd), reduction(max:maxDiff)
            for(std::size_t meBalls = 0; meBalls < balls + 1; ++ meBalls) {
                for(std::size_t meDucks = 0; meDucks < ducks + 1; ++ meDucks) {
                    const PlayerState me(meBalls, meDucks);
                    for(std::size_t themBalls = 0; themBalls < balls + 1; ++ themBalls) {
                        for(std::size_t themDucks = 0; themDucks < ducks + 1; ++ themDucks) {
                            const PlayerState them(themBalls, themDucks);
                            const std::size_t p1 = gameIndex(me, them);

                            Strategy s = solve(me, them, verbose);

                            NumT diff;

                            data[2+p1*2  ] = toDat(s.probMe[0]);
                            data[2+p1*2+1] = toDat(s.probMe[0] + s.probMe[1]);
                            current[p1] = s.expectedValue;
                            diff = current[p1].me - next[p1].me;
                            msd += diff * diff;
                            maxDiff = std::max(maxDiff, std::abs(diff));
                        }
                    }
                }
            }

            if(saveAll) {
                std::ofstream fs(filename(turn).c_str(), std::ios_base::binary);
                fs.write(&data[0], data.size());
                fs.close();
            }

            if(verbose) {
                std::cerr
                    << "Expectations changed by at most " << maxDiff
                    << " (RMSD: " << std::sqrt(msd / gameStates) << ")" << std::endl;
            }
            if(maxDiff < 0.0001f) {
                if(verbose) {
                    std::cerr << "Expectations have converged. Stopping." << std::endl;
                }
                break;
            }
            std::swap(next, current);
        }

        // Always save turn 0 with the final converged expectations
        std::ofstream fs(filename(0).c_str(), std::ios_base::binary);
        fs.write(&data[0], data.size());
        fs.close();
    }
};

void open_file(std::ifstream &target, int turn, int maxDucks, int maxBalls) {
    target.open(GameStore::filename(turn).c_str(), std::ios::binary);
    if(target.is_open()) {
        return;
    }

    target.open(GameStore::filename(0).c_str(), std::ios::binary);
    if(target.is_open()) {
        return;
    }

    Generator(maxBalls, maxDucks).generate(200, false, false);
    target.open(GameStore::filename(0).c_str(), std::ios::binary);
}

int choose(int turn, const PlayerState &me, const PlayerState &them, int maxBalls) {
    std::ifstream fs;
    open_file(fs, turn, std::max(me.ducks, them.ducks), maxBalls);

    unsigned char balls = fs.get();
    unsigned char ducks = fs.get();
    fs.seekg(GameStore(balls, ducks).fileIndex(me, them));
    unsigned char p0 = fs.get();
    unsigned char p1 = fs.get();
    fs.close();

    // only 1 random number per execution; no need to seed a PRNG
    std::random_device rand;
    int v = std::uniform_int_distribution<int>(0, 254)(rand);
    if(v < p0) {
        return 0;
    } else if(v < p1) {
        return 1;
    } else {
        return 2;
    }
}

int main(int argc, const char *const *argv) {
    if(argc == 4) { // maxTurns, maxBalls, maxDucks
        Generator(atoi(argv[2]), atoi(argv[3])).generate(atoi(argv[1]), true, true);
        return 0;
    }

    if(argc == 7) { // turn, meBalls, themBalls, meDucks, themDucks, maxBalls
        std::cout << choose(
            atoi(argv[1]),
            PlayerState(atoi(argv[2]), atoi(argv[4])),
            PlayerState(atoi(argv[3]), atoi(argv[5])),
            atoi(argv[6])
        ) << std::endl;
        return 0;
    }

    return 1;
}

Compiler en C ++ 11 ou supérieur. Pour les performances, il est bon de compiler avec le support OpenMP (mais ceci est juste pour la vitesse, ce n'est pas obligatoire)

g++ -std=c++11 -fopenmp pain_in_the_nash.cpp -o pain_in_the_nash

Ceci utilise les équilibres de Nash pour décider quoi faire à chaque tour, ce qui signifie que théorie, il gagnera ou tirera toujours à long terme (sur de nombreux jeux), quelle que soit la stratégie utilisée par l'adversaire. Que ce soit le cas dans la pratique dépend de mon erreur dans la mise en œuvre. Cependant, comme cette compétition KoTH n’a qu’un seul tour contre chaque adversaire, elle n’ira probablement pas très bien au classement.

À l’origine, mon idée était d’avoir une fonction d’évaluation simple pour chaque état de jeu (chaque balle vaut + b, chaque canard est + d), mais cela pose des problèmes évidents pour déterminer quelle devrait être cette évaluation. agir sur les rendements décroissants de la collecte de plus en plus de balles, etc. Donc, au lieu de cela, cela va analyser tout l'arbre , en revenant du tour 1000, et complétera les évaluations réelles en fonction de la façon dont chaque jeu pourrait se dérouler.

Le résultat est que je ne sais absolument pas quelle stratégie cela utilise, à part quelques comportements "évidents" codés de manière irréversible (lancer des boules de neige si vous avez plus de balles que votre adversaire n'a de balles + canards, et recharger si vous êtes tous les deux dehors de boules de neige). Si quelqu'un veut analyser l'ensemble de données qu'il produit, j'imagine qu'il y a un comportement intéressant à découvrir!

Tester cela contre "Save One" montre qu’il gagne effectivement à long terme, mais seulement par une petite marge (514 victoires, 486 défaites, 0 nuls dans le premier lot de 1000 matchs, et 509 victoires, 491 défaites, 0 dessine dans la seconde).


Important!

Cela fonctionnera immédiatement, mais ce n'est pas une bonne idée. Il faut environ 9 minutes sur mon ordinateur portable moyennement développé par les développeurs pour générer l’arborescence complète du jeu. Mais cela enregistrera les probabilités finales dans un fichier une fois qu'elles seront générées. Après cela, chaque tour générera simplement un nombre aléatoire et le comparera à 2 octets, ce qui le rend ultra rapide.

Pour raccourcir tout cela, il suffit de télécharger ce fichier (3,5 Mo) et de le placer dans le répertoire contenant l'exécutable.

Ou vous pouvez le générer vous-même en exécutant:

./pain_in_the_nash 1000 50 25

Ce qui sauvera un fichier par tour, jusqu'à la convergence. Notez que chaque fichier fait 3,5 Mo et qu'il convergera au tour 720 (soit 280 fichiers, environ 1 Go), et comme la plupart des jeux ne se rapprochent pas du tour 720, les fichiers de pré-convergence ont une très faible importance.

Dave
la source
Est-il possible de faire en sorte que le programme ne produise que le résultat final? Merci!
HyperNeutrino
@HyperNeutrino toutes les autres sorties doivent être sur stderr, elles ne devraient donc avoir aucun impact, mais je l’ai mis à jour pour ne montrer que les progrès accomplis lorsqu’il est exécuté en mode de prétraitement. Il n’écrit plus que sur stdout lorsqu’il fonctionne normalement. Je suggère cependant de suivre la suggestion "importante", car sinon, il ne restera que quelques minutes au premier tour (au moins, avec le prétraitement, vous pouvez voir la progression).
Dave
Ah d'accord. Je vais suivre cette suggestion, merci!
HyperNeutrino
Je vous serais reconnaissant de pouvoir télécharger les fichiers de données, car il faut toujours beaucoup de temps pour les générer tous. Si vous pouviez le faire, ce serait génial :)
HyperNeutrino
@HyperNeutrino OK, le téléchargement sur mon terrible Internet a également pris une éternité, mais le fichier convergent de 3,5 Mo est disponible ici: github.com/davidje13/snowball_koth_pitn/blob/master/… (il suffit de le placer dans le même répertoire).
Dave
1

Swift - TheCrazy_XcodeRandomness

Malheureusement, cela ne peut être exécuté que localement, dans Xcode, car il contient le Foundationmodule et sa fonction arc4random_uniform(),. Cependant, vous pouvez à peu près dire en quoi consiste l'algorithme:

import Foundation

func game(turn: Int, snowballs: Int, opponent_snowballs: Int, ducks: Int, opponent_ducks: Int, max_snowballs: Int) -> Int{
    let RELOAD = 0
    let THROW = 1
    let DUCK = 2
    if turn == 0{
        return arc4random_uniform(2)==0 ? THROW : DUCK
    }
    else if ducks == 0{
        if snowballs != 0{return THROW}
        else {return RELOAD}
    }
    else if snowballs < max_snowballs && snowballs != 0{
        if opponent_ducks == 0 && opponent_snowballs == 0{return THROW}
        else if opponent_snowballs == 0{
            return arc4random_uniform(2)==0 ? THROW : RELOAD
        }
        else if opponent_ducks == 0{return THROW}
        else { return arc4random_uniform(2)==0 ? THROW : RELOAD }
    }
    else if opponent_snowballs == max_snowballs{
        return DUCK
    }
    else if snowballs == max_snowballs || opponent_ducks < 1 || turn < max_snowballs{return THROW}
    return arc4random_uniform(2)==0 ? THROW : RELOAD
}
M. Xcoder
la source
Est-ce que cela peut être lancé à partir de bash sous Linux?
HyperNeutrino
@ HyperNeutrino Je sais que c'est possible sur macOS, mais je ne sais pas si c'est le cas sous Linux. Si vous pouvez vérifier cela, ce serait génial. Essayez la swiftcommande et ensuite vérifiez si cela fonctionne
M. Xcoder
Il semble ne pas exister; il y a un paquet avec ça mais ce n'est pas la langue de Swift. Je ne peux donc pas tester cela avant de pouvoir faire fonctionner quelque chose, désolé.
HyperNeutrino
les seuls compliants possibles sont Xcode et IntelliJ, mais il ne peut pas être exécuté en ligne car Foundation, désolé: /
M. Xcoder,
déchirure. J'aurais besoin de pouvoir l'exécuter depuis la ligne de commande pour exécuter le contrôleur avec, mais si j'en ai le temps, je pourrais l'exécuter à nouveau manuellement avec tous les autres robots.
HyperNeutrino
1

TableBot, Python 2

Appelé TableBot parce qu'il a été créé en implémentant cette table:

snow   duck   osnow   oduck   move
0      0      0       0       0
0      0      0       1       0
0      0      1       0       0
0      0      1       1       0
0      1      0       0       0
0      1      0       1       0
0      1      1       0       2
0      1      1       1       2
1      0      0       0       1
1      0      0       1       1
1      0      1       0       1
1      0      1       1       1
1      1      0       0       1
1      1      0       1       1
1      1      1       0       1
1      1      1       1       1

Un 1 signifie avoir 1 ou plus, un 0 signifie n'en avoir aucun.

Le bot:

import sys

reload=0
throw=1
duck=2

t,snowballs,o_snowballs,ducks,o_ducks,m=map(int,sys.argv[1:])

if snowballs > 0:
	print throw
elif ducks==0:
	print reload
elif o_snowballs==0:
	print reload
else:
	print duck

Essayez-le en ligne!

Camarade SparklePony
la source
1

AmbBot - Schéma de la raquette

Je voulais surtout essayer d'utiliser amb, parce que c'est cool. Ce bot ordonne au hasard les options (recharger, lancer et esquiver), filtre celles qui n’ont pas de sens et choisit la première option. Mais avecamb , on arrive à utiliser des continuations et des retours en arrière!

#lang racket
(require racket/cmdline)

; Defining amb.
(define failures null)

(define (fail)
  (if (pair? failures) ((first failures)) (error "no more choices!")))

(define (amb/thunks choices)
  (let/cc k (set! failures (cons k failures)))
  (if (pair? choices)
    (let ([choice (first choices)]) (set! choices (rest choices)) (choice))
    (begin (set! failures (rest failures)) (fail))))

(define-syntax-rule (amb E ...) (amb/thunks (list (lambda () E) ...)))

(define (assert condition) (unless condition (fail)))

(define (!= a b)
  (not (= a b)))

(define (amb-list list)
  (if (null? list)
      (amb)
      (amb (car list)
           (amb-list (cdr list)))))

; The meaningful code!
; Start by defining our options.
(define reload 0)
(define throw 1)
(define duck 2)

; The heart of the program.
(define (make-choice turn snowballs opponent_snowballs ducks opponent_ducks max_snowballs)
  (let ((can-reload? (reload-valid? snowballs opponent_snowballs ducks opponent_ducks max_snowballs))
        (can-throw? (throw-valid? snowballs opponent_snowballs ducks opponent_ducks max_snowballs))
        (can-duck? (duck-valid? snowballs opponent_snowballs ducks opponent_ducks max_snowballs)))
    (if (not (or can-reload? can-throw? can-duck?))
        (random 3) ; something went wrong, panic
        (let* ((ls (shuffle (list reload throw duck)))
               (action (amb-list ls)))
          (assert (or (!= action reload) can-reload?))
          (assert (or (!= action throw) can-throw?))
          (assert (or (!= action duck) can-duck?))
          action))))

; Define what makes a move possible.
(define (reload-valid? snowballs opponent_snowballs ducks opponent_ducks max_snowballs)
  (not (or
        (= snowballs max_snowballs) ; Don't reload if we're full.
        (and (= opponent_ducks 0) (= opponent_snowballs max_snowballs)) ; Don't reload if opponent will throw.
        )))

(define (throw-valid? snowballs opponent_snowballs ducks opponent_ducks max_snowballs)
  (not (or
        (= snowballs 0) ; Don't throw if we don't have any snowballs.
        (= opponent_snowballs max_snowballs) ; Don't throw if our opponent won't be reloading.
        )))

(define (duck-valid? snowballs opponent_snowballs ducks opponent_ducks max_snowballs)
  (not (or
        (= ducks 0) ; Don't duck if we can't.
        (= opponent_snowballs 0) ; Don't duck if our opponent can't throw.
        )))

; Parse the command line, make a choice, print it out.
(command-line
 #:args (turn snowballs opponent_snowballs ducks opponent_ducks max_snowballs)
 (writeln (make-choice
           (string->number turn)
           (string->number snowballs)
           (string->number opponent_snowballs)
           (string->number ducks)
           (string->number opponent_ducks)
           (string->number max_snowballs))))

J'ai également fait un petit programme de test pour exécuter deux de ces bots l'un contre l'autre. On a l'impression que le deuxième bot gagne plus souvent, alors j'ai peut-être commis une erreur quelque part.

(define (run)
  (run-helper 0 0 0 5 5 5))                         

(define (run-helper turn snowballs opponent_snowballs ducks opponent_ducks max_snowballs)
  (printf "~a ~a ~a ~a ~a ~a ~n" turn snowballs opponent_snowballs ducks opponent_ducks max_snowballs)
  (let ((my-action (make-choice turn snowballs opponent_snowballs ducks opponent_ducks max_snowballs))
        (opponent-action (make-choice turn opponent_snowballs snowballs opponent_ducks ducks max_snowballs)))
    (cond ((= my-action reload)
           (cond ((= opponent-action reload)
                  (run-helper (+ turn 1) (+ snowballs 1) (+ opponent_snowballs 1) ducks opponent_ducks max_snowballs))
                 ((= opponent-action throw)
                  (writeln "Opponent wins!"))
                 ((= opponent-action duck)
                  (run-helper (+ turn 1) (+ snowballs 1) opponent_snowballs ducks (- opponent_ducks 1) max_snowballs))))
          ((= my-action throw)
           (cond ((= opponent-action reload)
                  (writeln "I win!"))
                 ((= opponent-action throw)
                  (run-helper (+ turn 1) (- snowballs 1) (- opponent_snowballs 1) ducks opponent_ducks max_snowballs))
                 ((= opponent-action duck)
                  (run-helper (+ turn 1) (- snowballs 1) opponent_snowballs ducks (- opponent_ducks 1) max_snowballs))))
          ((= my-action duck)
           (cond ((= opponent-action reload)
                  (run-helper (+ turn 1) snowballs (+ opponent_snowballs 1) (- ducks 1) opponent_ducks max_snowballs))
                 ((= opponent-action throw)
                  (run-helper (+ turn 1) snowballs (- opponent_snowballs 1) (- ducks 1) opponent_ducks max_snowballs))
                 ((= opponent-action duck)
                  (run-helper (+ turn 1) snowballs opponent_snowballs (- ducks 1) (- opponent_ducks 1) max_snowballs)))))))
Andrew dit Réintégrer Monica
la source
1

MonteBot, C ++

J'ai essentiellement pris le code de ce koth et l' ai modifié pour ce défi. Il utilise l'algorithme de recherche d'arbres Monte Carlo UCT découplé. Il devrait être assez proche de l'équilibre nash.

#include <cstdlib>
#include <cmath>
#include <random>
#include <cassert>
#include <iostream>


static const int TOTAL_ACTIONS = 3;
static const int RELOAD = 0;
static const int THROW = 1;
static const int DUCK = 2;

//The number of simulated games we run every time our program is called.
static const int MONTE_ROUNDS = 10000;

struct Game
{
    int turn;
    int snowballs;
    int opponentSnowballs;
    int ducks;
    int opponentDucks;
    int maxSnowballs;
    bool alive;
    bool opponentAlive;

    Game(int turn, int snowballs, int opponentSnowballs, int ducks, int opponentDucks, int maxSnowballs)
        : turn(turn),
          snowballs(snowballs),
          opponentSnowballs(opponentSnowballs),
          ducks(ducks),
          opponentDucks(opponentDucks),
          maxSnowballs(maxSnowballs),
          alive(true),
          opponentAlive(true)
    {
    }

    Game(int turn, int snowballs, int opponentSnowballs, int ducks, int opponentDucks, int maxSnowballs, bool alive, bool opponentAlive)
        : turn(turn),
        snowballs(snowballs),
        opponentSnowballs(opponentSnowballs),
        ducks(ducks),
        opponentDucks(opponentDucks),
        maxSnowballs(maxSnowballs),
        alive(alive),
        opponentAlive(opponentAlive)
    {
    }

    bool atEnd() const
    {
        return !(alive && opponentAlive) || turn >= 1000;
    }

    bool isValidMove(int i, bool me)
    {
        if (atEnd())
        {
            return false;
        }

        switch (i)
        {
        case RELOAD:
            return (me ? snowballs : opponentSnowballs) < maxSnowballs;
        case THROW:
            return (me ? snowballs : opponentSnowballs) > 0;
        case DUCK:
            return (me ? ducks : opponentDucks) > 0 && (me ? opponentSnowballs : snowballs) > 0;
        default:
            throw "This should never be executed.";
        }

    }

    Game doTurn(int my_action, int enemy_action)
    {
        assert(isValidMove(my_action, true));
        assert(isValidMove(enemy_action, false));

        Game result(*this);

        result.turn++;

        switch (my_action)
        {
        case RELOAD:
            result.snowballs++;
            break;
        case THROW:
            result.snowballs--;
            if (enemy_action == RELOAD)
            {
                result.opponentAlive = false;
            }
            break;
        case DUCK:
            result.ducks--;
            break;
        default:
            throw "This should never be executed.";
        }

        switch (enemy_action)
        {
        case RELOAD:
            result.opponentSnowballs++;
            break;
        case THROW:
            result.opponentSnowballs--;
            if (my_action == RELOAD)
            {
                result.alive = false;
            }
            break;
        case DUCK:
            result.opponentDucks--;
            break;
        default:
            throw "This should never be executed.";
        }

        return result;
    }
};

struct Stat
{
    int wins;
    int attempts;

    Stat() : wins(0), attempts(0) {}
};

/**
* A Monte tree data structure.
*/
struct MonteTree
{
    //The state of the game.
    Game game;

    //myStats[i] returns the statistic for doing the i action in this state.
    Stat myStats[TOTAL_ACTIONS];
    //opponentStats[i] returns the statistic for the opponent doing the i action in this state.
    Stat opponentStats[TOTAL_ACTIONS];
    //Total number of times we've created statistics from this tree.
    int totalPlays = 0;

    //The action that led to this tree.
    int myAction;
    //The opponent action that led to this tree.
    int opponentAction;

    //The tree preceding this one.
    MonteTree *parent = nullptr;

    //subtrees[i][j] is the tree that would follow if I did action i and the
    //opponent did action j.
    MonteTree *subtrees[TOTAL_ACTIONS][TOTAL_ACTIONS] = { { nullptr } };

    MonteTree(const Game &game) :
        game(game), myAction(-1), opponentAction(-1) {}


    MonteTree(Game game, MonteTree *parent, int myAction, int opponentAction) :
        game(game), myAction(myAction), opponentAction(opponentAction), parent(parent)
    {
        //Make sure the parent tree keeps track of this tree.
        parent->subtrees[myAction][opponentAction] = this;
    }

    //The destructor so we can avoid slow ptr types and memory leaks.
    ~MonteTree()
    {
        //Delete all subtrees.
        for (int i = 0; i < TOTAL_ACTIONS; i++)
        {
            for (int j = 0; j < TOTAL_ACTIONS; j++)
            {
                auto branch = subtrees[i][j];

                if (branch)
                {
                    branch->parent = nullptr;
                    delete branch;
                }
            }
        }
    }

    double scoreMove(int move, bool me)
    {

        const Stat &stat = me ? myStats[move] : opponentStats[move];
        return stat.attempts == 0 ?
            HUGE_VAL :
            double(stat.wins) / stat.attempts + sqrt(2 * log(totalPlays) / stat.attempts);
    }


    MonteTree * expand(int myAction, int enemyAction)
    {
        return new MonteTree(
            game.doTurn(myAction, enemyAction),
            this,
            myAction,
            enemyAction);
    }

    int bestMove() const
    {
        //Select the move with the highest win rate.
        int best;
        double bestScore = -1;
        for (int i = 0; i < TOTAL_ACTIONS; i++)
        {
            if (myStats[i].attempts == 0)
            {
                continue;
            }

            double score = double(myStats[i].wins) / myStats[i].attempts;
            if (score > bestScore)
            {
                bestScore = score;
                best = i;
            }
        }

        return best;
    }
};

int random(int min, int max)
{
    static std::random_device rd;
    static std::mt19937 rng(rd());

    std::uniform_int_distribution<int> uni(min, max - 1);

    return uni(rng);
}

/**
* Trickle down root until we have to create a new leaf MonteTree or we hit the end of a game.
*/
MonteTree * selection(MonteTree *root)
{
    while (!root->game.atEnd())
    {
        //First pick the move that my bot will do.

        //The action my bot will do.
        int myAction;
        //The number of actions with the same bestScore.
        int same = 0;
        //The bestScore
        double bestScore = -1;

        for (int i = 0; i < TOTAL_ACTIONS; i++)
        {
            //Ignore invalid or idiot moves.
            if (!root->game.isValidMove(i, true))
            {
                continue;
            }

            //Get the score for doing move i. Uses
            double score = root->scoreMove(i, true);

            //Randomly select one score if multiple actions have the same score.
            //Why this works is boring to explain.
            if (score == bestScore)
            {
                same++;
                if (random(0, same) == 0)
                {
                    myAction = i;
                }
            }
            //Yay! We found a better action.
            else if (score > bestScore)
            {
                same = 1;
                myAction = i;
                bestScore = score;
            }
        }

        //The action the enemy will do.
        int enemyAction;

        //Use the same algorithm to pick the enemies move we use for ourselves.
        same = 0;
        bestScore = -1;
        for (int i = 0; i < TOTAL_ACTIONS; i++)
        {
            if (!root->game.isValidMove(i, false))
            {
                continue;
            }

            double score = root->scoreMove(i, false);
            if (score == bestScore)
            {
                same++;
                if (random(0, same) == 0)
                {
                    enemyAction = i;
                }
            }
            else if (score > bestScore)
            {
                same = 1;
                enemyAction = i;
                bestScore = score;
            }
        }

        //If this combination of actions hasn't been explored yet, create a new subtree to explore.
        if (!(*root).subtrees[myAction][enemyAction])
        {
            return root->expand(myAction, enemyAction);
        }

        //Do these actions and explore the next subtree.
        root = (*root).subtrees[myAction][enemyAction];
    }
    return root;
}

/**
* Chooses a random move for me and my opponent and does it.
*/
Game doRandomTurn(Game &game)
{
    //Select my random move.
    int myAction;
    int validMoves = 0;

    for (int i = 0; i < TOTAL_ACTIONS; i++)
    {
        //Don't do idiotic moves.
        //Select one at random.
        if (game.isValidMove(i, true))
        {
            validMoves++;
            if (random(0, validMoves) == 0)
            {
                myAction = i;
            }
        }
    }

    //Choose random opponent action.
    int opponentAction;

    //Whether the enemy has encountered this situation before
    bool enemyEncountered = false;

    validMoves = 0;

    //Weird algorithm that works and I don't want to explain.
    //What it does:
    //If the enemy has encountered this position before,
    //then it chooses a random action weighted by how often it did that action.
    //If they haven't, makes the enemy choose a random not idiot move.
    for (int i = 0; i < TOTAL_ACTIONS; i++)
    {
        if (game.isValidMove(i, false))
        {
            validMoves++;
            if (random(0, validMoves) == 0)
            {
                opponentAction = i;
            }
        }
    }

    return game.doTurn(myAction, opponentAction);
}


/**
* Randomly simulates the given game.
* Has me do random moves that are not stupid.
* Has opponent do random moves.
*
* Returns 1 for win. 0 for loss. -1 for draw.
*/
int simulate(Game game)
{
    while (!game.atEnd())
    {
        game = doRandomTurn(game);
    }

    if (game.alive > game.opponentAlive)
    {
        return 1;
    }
    else if (game.opponentAlive > game.alive)
    {
        return 0;
    }
    else //Draw
    {
        return -1;
    }
}


/**
* Propagates the score up the MonteTree from the leaf.
*/
void update(MonteTree *leaf, int score)
{
    while (true)
    {
        MonteTree *parent = leaf->parent;
        if (parent)
        {
            //-1 = draw, 1 = win for me, 0 = win for opponent
            if (score != -1)
            {
                parent->myStats[leaf->myAction].wins += score;
                parent->opponentStats[leaf->opponentAction].wins += 1 - score;
            }
            parent->myStats[leaf->myAction].attempts++;
            parent->opponentStats[leaf->opponentAction].attempts++;
            parent->totalPlays++;
            leaf = parent;
        }
        else
        {
            break;
        }
    }
}

int main(int argc, char* argv[])
{
    Game game(atoi(argv[1]), atoi(argv[2]), atoi(argv[3]), atoi(argv[4]), atoi(argv[5]), atoi(argv[6]));

    MonteTree current(game);

    for (int i = 0; i < MONTE_ROUNDS; i++)
    {
        //Go down the tree until we find a leaf we haven't visites yet.
        MonteTree *leaf = selection(&current);

        //Randomly simulate the game at the leaf and get the result.
        int score = simulate(leaf->game);

        //Propagate the scores back up the root.
        update(leaf, score);
    }

    int move = current.bestMove();

    std::cout << move << std::endl;

    return 0;
}

Instructions de compilation pour Linux:

Enregistrer dans MonteBot.cpp.
Courirg++ -o -std=c++11 MonteBot MonteBot.cpp .

Commande à exécuter: ./MonteBot <args>

Le numéro un
la source
1

Le procrastinateur - Python 3

Le procrastinateur va tergiverser en jouant en sauvegarde les deux premiers tours. Soudain, le monstre panique veut éviter de perdre la guerre des ressources en contrant le coup le plus utilisé par ses adversaires.

import sys

turn, snowballs, opponent_snowballs, ducks, opponent_ducks, max_snowballs = map(int, sys.argv[1:])

max_ducks = 25
times_opponent_ducked = max_ducks - ducks 
times_opponent_thrown = (turn - times_opponent_ducked - opponent_snowballs) / 2
times_opponent_reloaded = times_opponent_thrown + opponent_snowballs


## return a different action, if the disiered one is not possible
def throw():
    if snowballs:
        return 1
    else:
        return duck()

def duck():
    if ducks:
        return 2
    else:
        return reload()

def reload():
    return 0





def instant_gratification_monkey():
    ## throw, if you still have a ball left afterwards
    if snowballs >= 2 or opponent_ducks == 0:
        return throw()
    ## duck, if opponent can throw
    elif opponent_snowballs > 0:
        return duck()
    ## reload, if opponent has no balls and you have only one
    else:
        return reload()

def panic_monster():
    ## throw while possible, else reload
    if times_opponent_reloaded > times_opponent_ducked: 
        if snowballs > 0:
            return throw() 
        else:
            return reload()
    ## alternating reload and duck
    else: 
        if turn % 2 == 1:
            return reload() 
        else:
            return duck()

def procrastinator():     
    if turn < 13 or (snowballs + ducks > opponent_snowballs + opponent_ducks):
        return instant_gratification_monkey()
    else:
        return panic_monster()


print(procrastinator())
Erbsenhirn
la source
"Le Procrastinateur". Donc, tous les membres du PPCG qui étaient censés faire leurs devoirs? (Ne le niez pas, ceux qui ont lu ça. Et moi)
HyperNeutrino
1
"Singe de gratification instantanée" Vous avez vu ce TEDTalk aussi? :)
HyperNeutrino
0

ParanoidBot et PanicBot - ActionScript3 ( RedTamarin )

D’un langage de niche peu adapté (avec des extensions pour fournir des arguments en ligne de commande), c’est Skullish ParanoidBot et son ennuyeux allié, PanicBot.

ParanoidBot

ParanoidBot a perdu la tête et doit compter sur une stratégie inutilement spécifique. Premièrement, il lance des boules de neige jusqu’à atteindre un seuil et en garde quelques-unes en réserve. Après trois canards prudents, la paranoïa s'installe et le bot tente de stocker plus de boules de neige entre des canards aléatoires. Après avoir reconstitué son stock, ParanoidBot recommence à lancer à l'aveuglette. En raison des voix dans sa tête, ParanoidBot peut dire s'il est assuré de gagner ou de perdre, et va "élaborer des stratégies" en conséquence.

import shell.Program;
import shell;

var TURN:int = Program.argv[0];
var SB:int = Program.argv[1];
var OPSB:int = Program.argv[2];
var DC:int = Program.argv[3];
var OPDC:int = Program.argv[4];
var MAXSB:int = Program.argv[5];
var usedDucks:int = 0;

if (!FileSystem.exists("data"))
    FileSystem.write("data", 0);
else
    usedDucks = FileSystem.read("data");

if (SB > OPSB + OPDC)
{ trace(1); Program.abort(); }
if (SB + DC < OPSB) {
if (DC > 0)
    trace(2);
else if (SB > 0)
    trace(1);
else
    trace(0);
Program.abort(); }

if (usedDucks >= 3) {
    if (SB > MAXSB / 3) {
        usedDucks = 0;
        FileSystem.write("data", usedDucks);
        trace(1);
        Program.abort();
    }
    else {
        if (Number.random() > 0.5 && DC > 0)
            trace(2);
        else
            trace(0);
    }
}
else {
    if (SB > (MAXSB / 6) && SB >= 3)
    { trace(1); Program.abort(); }
    else {
        usedDucks++;
        FileSystem.write("data", usedDucks);
        if (DC > 0)
            trace(2);
        else if (SB > 0)
            trace(1);
        else
            trace(0);
        Program.abort();
    }
}

Les bretelles sont un peu débiles pour aider à condenser la taille

PanicBot

PanicBot, déjà devenu fou, réagit par peur instinctive. Après avoir manqué de peur, PanicBot lance aveuglément toutes ses boules de neige, puis fabrique et lance désespérément d'autres boules de neige jusqu'à ce qu'il soit (probablement) vaincu.

import shell.Program;

var SB:int = Program.argv[1];
var DC:int = Program.argv[3];

if (DC > 0)
{ trace(2); Program.abort(); }
if (SB > 0)
{ trace(1); Program.abort(); }
else
{ trace(0); Program.abort(); }



Il s'agit d'une des moins de 15 autres entrées utilisant AS3 ici sur PPCG. Un jour, peut-être que cette langue sans doute exotique trouvera une énigme à dominer.


la source
Cela peut-il être exécuté à partir de bash sous Linux?
HyperNeutrino
Je n'ai pas testé cela, mais oui, ça devrait. L'exécutable RedTamarin (redshell) est conçu pour Windows, Mac et Linux: http://redtamarin.com/tools/redshell . Si l'un des robots ci-dessus est enregistré dans un fichier nommé snow.as, les éléments suivants doivent fonctionner dans le $ ./redshell snow.as -- 0 50 50 25 25
Cela me donne une erreur d'autorisation refusée lorsque j'essaie de l'exécuter.
HyperNeutrino
@HyperNeutrino chmod +x redshellest votre ami ici ...
Erik the Outgolfer
Peut-être que chmod 777 tout? Il y a peut-être quelques problèmes sur le site web de
0

Defender, Python

Recharge quand aucun joueur n'a de boule de neige. Si elle a des boules de neige, elle jette. S'il n'a pas de boule de neige, mais que l'adversaire en a une, elle se cache si elle le peut, sinon elle recharge.

def get_move(turn, snowballs, opponent_snowballs, ducks, opponent_ducks, max_snowballs):
    if snowballs == opponent_snowballs == 0:
        return 0 #Reload
    elif snowballs > 0:
        return 1 # Throw
    elif ducks > 0:
        return 2 # Duck
    else:
        return 0 # Reload

if __name__ == "__main__": # if this is the main program
    import sys
    print(main(*[int(arg) for arg in sys.argv[1:]]))

Note: pas encore testé

Salomon Ucko
la source