カテゴリー
研究

General Game Playing における 類似盤面を利用したモンテカルロ木探索性能向上の試み

2022年11月11日~13日に開催された第27回ゲームプログラミングワークショップ(GPW-22) において、修士2年の上宮佳晃が、「General Game Playing における一般性の高い類似盤面利用手法の検討」の研究発表を行いました。

  • 上宮 佳晃, 横山 大作, General Game Playing における一般性の高い類似盤面利用手法の検討, 第27回ゲームプログラミングワークショップ(GPW-22), 5-1, 2022.11.12. (PDF)

General Game Playingとは?

近年、囲碁や将棋といったボードゲームでは、研究の発展によってプロをも超える実力を発揮できるゲームAIが開発されています。その一方で、このようなゲームAIは扱うゲームに特化した設計がなされている場合が多く、瞬時に他のゲームをうまくプレイすることができません。この課題に対してGeneral Game Playing(GGP)では、初見のゲームに対してそのゲームのルールを与えるだけで、上手にプレイできるゲームAIの実現を目指します。迷路のような1人用ゲームからチェスや将棋といった対戦ゲーム、chinese checkersのような多人数ゲームなど、人数や指し手の規模を問わずに様々なゲームをプレイするため、ゲーム固有の知識や技術に頼ることなく、汎用的なプログラムの設計が求められます。

研究のアプローチ

GGPの研究では汎用的に勝率を上げるゲームAIを構築するために、扱うゲームの正確な評価関数を必要としないモンテカルロ木探索(MCTS)の活用が主流となっています。MCTSでは繰り返し自己対戦を行うことで、ゲーム展開の記録を木のような構造で保存していき、そのシミュレーションの結果から最善だと思われる次の一手を選択するアルゴリズムです。私の研究では、類似する盤面からは同じ勝敗が期待できると考え、MCTSのシミュレーションの過程で類似盤面を活用して、少ないシミュレーション回数でも十分な探索ができることを試みました。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です