This report investigates the game balance of Philip Sabin's educational wargameCounter Air using AlphaZero and MCTS. The results show that the attacking side has theadvantage and finds a better strategy faster than the defender. When two AlphaZero agents playagainst each other, the attacker does not lose to the defender after a certain point in the traininghas been reached. When AlphaZero agents play against MCTS, the attacking AlphaZero agentfinds a winning strategy against MCTS faster than the defending AlphaZero agent.
Denna rapport undersöker spelbalansen i Philip Sabins utbildande krigsspelCounter Air med AlphaZero. Resultaten visar att den attackerande sidan har övertag i Counter Airoch finner en bättre strategi snabbare än försvararen. När två AlphaZero agenter spelar motvarandra förlorar inte den attackerande sidan mot den försvarande efter att ha nått en viss punkt iträningen. När AlphaZero agenter spelar mot MCTS hittar den attackerande AlphaZero agenten envinnande strategi mot MCTS snabbare än den försvarande AlphaZero agenten.