カテゴリー
研究

正体隠匿型ゲームにおける相手プレイヤの推定に向けて

2024年3月8日~9日に開催された「第51回ゲーム情報学研究発表会」において、修士1年の木島花蓮が、「複数種類の戦略を持つプレイヤが混在する不完全情報ゲームにおける相手プレイヤの推定にむけて」の研究発表を行いました。

  • 木島 花蓮, 横山 大作, 複数種類の戦略を持つプレイヤが混在する不完全情報ゲームにおける相手プレイヤの推定に向けて, 第51回ゲーム情報学研究会, 2024.3.8~2023.3.9, (PDF)

研究目的、背景

ゲームに関する研究として、「AlphaZero」など、「完全情報ゲーム」と呼ばれる、ゲーム中の全ての段階であらゆる情報が分かるゲームにおいては、人間に勝るコンピュータプレイヤが数多く存在します。しかし、相手の手札など一部の情報が隠されている「不完全情報ゲーム」はまだ研究途中にあります。この不完全情報ゲームの中でも、正体隠匿型ゲームと呼ばれる、隠された陣営や役職があり、その推定をしながら進めていくゲームがあります。代表例としては人狼のようなゲームが挙げられますが、このようなゲームの多くは他のプレイヤの陣営や役職、戦略等を推定することがゲームの勝敗に大きくかかわります。そのため、このようなゲームでは他プレイヤの陣営を推定しながら行動するコンピュータプレイヤの作成を目的とした研究が存在します。

このようなゲームの研究として、人狼についての研究は多く進められていますが、人狼ゲームでは会話をもとに推定を行うことから、発言情報の分類や会話での他プレイヤの説得など、推定にも複雑な要素が必要となります。また、人狼ゲームでは話し合いの結果から投票する形となるため、推定が正しく行われても、直接的に攻撃することができません。そのため推定精度の勝率への影響が少ないことから、推定手法の評価がやや困難であると考えられます。そこで、今回私は、発言を推定に加味せず、推定部分がより勝敗に直結するゲームである「ShadowRaiders」を用いることで、陣営や戦略の推定を重視した行動選択を行うコンピュータプレイヤの構築を行うことを目的としました。

ShadowRaiders

提案手法

コンピュータプレイヤ5人でShadowRaidersをプレイし、敵味方、第3陣営を正しく判別できるかを判断する陣営推定と、それぞれの勝利条件を正しく推定できるかの戦略推定の2つの手法の提案と評価を行いました。どちらも深層強化学習を用いて、他プレイヤの攻撃等の行動や、推理カードといった環境から得られる情報を入力として推定を行いました。アルゴリズムには「Deep Deterministic Policy Gradient」を使用しています。

陣営推定の実験結果

結果として、陣営推定は学習に成功し、70%程度の精度で推定を行えました。また、勝率も60%程度となり、どちらも作成したランダムやヒューリスティックなプレイヤより高い精度となりました。しかし、戦略推定については学習が成功しませんでした。今後の展望として、入力情報や報酬の与え方を変更することで、陣営推定の精度向上や、戦略推定の学習成功につなげられるのではないかと考えています。

カテゴリー
研究

ローグライクゲームの強化学習を目標とする,行動の事前学習手法の評価

2024年3月8日~9日に国立情報学研究所で行われた第51回ゲーム情報学研究会において、修士2年の山下が、「ローグライクゲームの強化学習を目指した行動の事前学習の試み」の研究発表を行いました。

  • 山下 興紀, 横山 大作, ローグライクゲームの強化学習を目標とする,行動の事前学習手法の評価, 第51回ゲーム情報学研究会, 2024.3.8~2023.3.9, (PDF)

研究背景・目的

強化学習によるゲーム攻略は近年盛んに行われており、囲碁であれば「AlphaGo」、将棋であれば「Ponanza」などが有名となりました。しかし強化学習も万能ではなく、学習することを苦手とするゲームが存在します。今回題材として取り上げたローグライクゲームは、「不完全情報」「ランダム性」「疎な報酬」「有効な行動の少なさ」などの性質により、強化学習での学習が困難となっています。実験を進める中で、重要な行動でありながら、学習が困難となっていた「階段を降りる」行動に焦点を絞り、NetHackの実験用環境下で「階段を降りる」行動を高頻度で行えるプレイヤの作成を目標しました。

本研究のアプローチ

本研究では、強化学習を行う前の段階で、ヒューリスティックプレイヤが過去にプレイした履歴データを使用し事前学習を行い、事前学習により作成されたエージェントを再学習するアプローチを取りました。学習の際には、事前学習の手法として、模倣学習に使われるアルゴリズム「Behavior Cloning」を使用し、強化学習の手法としては「Proximal Policy Optimization」を使用しています。

学習のイメージ

結果として、事前学習を行わなかった場合と比較して「階段を降りる行動」の頻度は上昇し、一定の有効性を示すことが出来ました。しかし性能面で、学習元としていたヒューリスティックプレイヤの性能に劣るという課題が残りました。今後の展望として、状態に応じて複数エージェントを用意する事で、対応しきれなかった今回の環境に対して、より良い結果を出せるのではないかと考えています。

カテゴリー
研究

3D都市モデルを利用して景観の良い経路を推薦する

2024年2月28日~3月1日(オンライン)と3月4日から5日(オンサイト)に開催された「第16回データ工学と情報マネジメントに関するフォーラム(DEIM2024)」において、修士2年の斎藤康平が、「3D都市モデルを利用した移動中の景観を考慮する観光経路推薦手法の検討」について研究発表を行いました。

  • 斎藤 康平, 横山 大作, 3D都市モデルを利用した移動中の景観を考慮する観光経路推薦手法の検討, 第16回データ工学と情報マネジメントに関するフォーラム(DEIM2024), 2024.3.5. (pdf)

昨今では自動車で遠隔地に移動する際は、カーナビや地図アプリなどを用いて目的地まで移動することが主な移動手段になっています。移動する目的としては、通勤や通学、私事、観光など多岐にわたります。通勤や通学を目的とした場合、カーナビなどから得られる最速経路や最短経路であれば、ユーザーの欲求を満たすことができると思われます。しかし、観光やレジャーなどを目的とした場合は、早く移動したいという欲求のほかに良い景観を眺めながら移動したいという欲求も考えられます。そこで観光を主目的とした景観の良い経路推薦手法を検討しました。

景観の良さを考慮した経路推薦手法は既に数多くの手法があります。例えば、DEMデータ(数値標高モデル)と呼ばれる3Dモデルを利用して、道路上から景観の対象が経路全体のうちどの程度見えているのかを評価し、最も景観の対象を見ることができる経路を推薦する手法があります。しかし、見えているからと言って同じ評価ができない可能性が考えられます。例として景観の対象を東京スカイツリーとしたとき、1枚目は東京スカイツリーのおおよそ全体が写っているためある程度景観が良いとできますが、2枚目は2枚目はツリーの根元部分しか写っていないため、あまり景観が良くないと言えます。

このような景観の対象の見え方に差をつけることができる評価方法を検討し、その評価に則った景観の良い経路推薦を試みました。

正確な景観を取得するため、国土交通省が主導するプロジェクトであるPLATEAUを利用して景観画像をレンダリングしました。レンダリングした画像を基に、景観の良さに関わりのあるいくつかの値を説明変数とし、人間が評価した景観の良さを数値化したものを目的変数としました。それに回帰分析を適用することで景観の良さを推定しました。

推定された景観の良さから経路全体の景観の良さを計算することで見え方を考慮した景観の良い経路推薦を行うことができました。

今回は景観の対象を東京スカイツリーに限定した経路推薦を行いましたが、景観の対象が複数ある場合や対象の建築物が横長である場合などに対応させる必要があります。今後は景観だけではなく、経路の運転のしやすさなどにも着目した経路推薦手法を検討する必要があると考えています。

カテゴリー
研究

イラストの制作を助ける配色支援システム

2024年3月6日~2024年3月8日に開催された「INTERACTION2024」において、学部4年生の江馬龍之介が「配色の可視化と配色技法の推定によるイラスト制作支援ツールの開発」というタイトルでインタラクティブ発表をしました。

論文情報

江馬龍之介, 横山大作. 配色の可視化と配色技法の推定によるイラスト制作支援ツールの開発. INTERACTION2024 3B27.

論文はこちら


研究概要

イラストの色塗りにおいて配色は、作品の印象を決定づける要素の一つです。一般的に色を塗る際、イラストレーターは経験に基づいて色塗りを行っていますが、初心者は経験が浅いため配色バランスが崩れてしまいやすいと考えられます。そのため、使われている色の数や色相の配置を利用者が把握することが重要です。そこで、本研究ではキャンバス上の配色を色相環に可視化するとともに、意図に近いバランスの取れた配色技法を推薦して,同様に表示する手法を提案します。推定は代表的な6種類の配色技法の中から行うことにしました。配色バランスが取れているイラスト20枚に対して提案システムを試したところ,8割のイラストに対して正しく主要な色の抽出が行われ,キャンバス上の配色を可視化することが出来ました。また,6割のイラストに対して推定された配色が納得できる結果になりました。

提案システム利用例

上記の図のように、現在使われている配色技法の推定結果を黒色 、それに対しておすすめの配色技法を推薦を赤色で色相環上に可視化することで、配色技法を知らない初心者でも美しいとされる配色の色塗りを可能にしてくれます。

研究動機

初心者は色塗りの配色に慣れていないため、どの色を使うべきかの判断が難しいと考えられます。具体的には、赤色と橙色を使ってイラストを描いているときに、アクセントカラーとして何色を使うのが良いのかが分からない場合などが挙げられます。それに対し、色を塗っている最中に現在の配色とおすすめの配色技法を可視化することで、相性の良いアクセントカラーを選ぶことが可能になります。

提案手法

提案システムの構成
  1. キャンバスの色情報を取得
  2. 色情報から配色を推定
  3. 最も適していると考えられる配色技法を推薦
    • 配色技法は上記の代表的な6つの配色技法から推薦
  4. 2,3の配色を可視化

ユーザーインターフェース

本研究で作成したユーザーインターフェースは、以下の二種類の方法で配色技法を推薦してくれます。

赤:使われている配色を修正したものを推薦するもの

(3色の配色→3色の配色技法の推薦など)

緑:使われている配色に新たに加える色を推薦するもの  

(2色の配色→3色の配色技法の推薦など)

利用例

利用例
  1. 線画イラストに対して、自由に色を塗っていく
  2. 塗られた赤色に対して、ドミナントカラー配色とダイアード配色を推薦
  3. 塗られた橙色に対して、ドミナントカラー配色とスプリットコンプリメンタリー配色を推薦
  4. 塗られた水色に対して、スプリットコンプリメンタリー配色を推薦
  5. スプリットコンプリメンタリー配色のイラストが完成

評価

評価に用いたイラストの一部(絵: ノーコピーライトガールより)

配色バランスが取れているイラスト20枚に対して提案システムを試しました。正しく主要な色の抽出が行われ,8割のイラストに対して使われている配色,6割のイラストに対して推薦された配色が納得できる結果になりました。

発表の様子

インタラクション2024の参加者は891名と近年最多であり、3日間を通して活発な議論を行うことが出来ました。

概要説明発表の様子
インタラクティブ発表の様子

カテゴリー
研究

複雑な議事録から政策に対する姿勢を分析する

2024年3月11日~15日に神戸国際会議場で行われた言語処理学会第30回年次大会(NLP2024)において、学部4年の尾崎 慎太郎が、「国会議事録を使用した政党ごとのスタンス変遷の分析」という題目で口頭発表を行いました。


論文の情報

尾崎 慎太郎, 横山大作. 国会議事録を使用した政党ごとのスタンス変遷の分析. 言語処理学会 第30回年次大会.pp. 2487-2492, 2024.
@inproceedings{ozaki_yokoyama_2024,
  author    = {尾崎 慎太郎 and 横山大作},
  title     = {国会議事録を使用した政党ごとのスタンス変遷の分析},
  booktitle = {言語処理学会 第30回年次大会},
  pages     = {2487--2492},
  year      = {2024},
}

論文はこちら

研究内容について

筆者は「国会議事録を使用した政党ごとのスタンス変遷の分析」というテーマで発表しました。
昨今、多くの若者が選挙に参加しないことが問題として挙がっているかと思います。ここに目をつけ、Web上にある国会議事録を使用して、政党がどの政策に対して重きを置いているか、また政策に対して一貫して賛成(または反対)を続けているのかどうかを可視化することを目指しました。

実際に複雑な議事録を読んでみる

「Web上にある国会議事録を読めば理解できるのでは?」と考える方もいるかと思います。しかし上記の画像を見てみると、議事録というだけあって「えー」や「あのー、」などのフィラーであったり、「あるというふうに考えております。」などの話し言葉独特の単語が多く並んでいたり、「会計検査院法第三十四条や第三十六条の規定」などの非常に難しい専門用語が並んでいたりしており、法律分野に詳しくない人間からすると非常に読むことに時間がかかります。上記は一部抜粋ですが、このような文章が通常国会であれば1年で150日分あります。
ぜひ、一度読んで苦痛を体感してみてください。


本研究はこの問題点に着目して、このような複雑な国会議事録を機械に読ませ、数値として可視化することで、他党とも比較でき、どの政党がどの政策に一貫して賛成(または反対)と言い続けているのか(一貫しているか)。ということを分析しました。

直近2年間の国会議事録を使用して、何について話しているか要約するモデルと、その文章が賛成なのか反対なのかを分類するモデルを用意します。そして、要約した文章を本研究では正解と見立てた政策一覧(リンクは選挙ドットコム)とベクトル検索を実行し、最も関連度の高い政策を見つけます。政策一覧に書かれてある政党のスタンス(賛成の立場なのか、反対の立場なのか)が分類モデルの推測したスタンスと一致しているかどうかを比較します。最後に、比較した結果が正しければ(選挙公約でのスタンスと、国会でのスタンスが一致しているということ)1, 正しくなければ0とし、数値として表しました。

本研究の全体図

数値として表した結果は、ぜひ論文を読んで確認してください。今後の展望として2つほど挙げるとすると、1つは「得られた結果が本当に正しいかどうか判断する必要がある。」こと、もう1つは「大規模言語モデル(LLM)を使用して評価する」ということがあります。
前者に関して、今回は正解データを選挙ドットコムが掲載した政策一覧としましたが、この情報が本当に正しいかどうか確証はありません。そのため、比較した結果がある意味選挙ドットコムに委ねられています。今後は、複数の政策一覧を用いるなどして、正解データの信憑性を上げる必要があると考えます。
また、昨今話題のLLMを用いて評価もしたいと思っています。LLMの汎化能力でどこまで議事録を理解できるのか、そして正確に賛否を分類できるのか、要約できるかなど興味深いことが多くあります。特に、議事録では「人の目で見ると、なんとなく反対のニュアンスを含む文章だな。」という文章が多くあります。このような文章をLLMが理解できるのか、などこの研究から派生できることも多くあると思うので、ぜひ試したいと思います。

言語処理学会(NLP)

神戸の国際会議場で開催された第30回大会では、参加者が2045名、発表者数が599名とどちらも過去最多の人数となりました。

スポンサー企業も多く、NLP界隈の盛り上がりを強く感じました。スワッグも可愛いものが多かったです。

言語処理学会 第30回年次大会
カテゴリー
研究

ゲームプログラミングワークショップ2023に参加

書誌情報

情報処理学会 ゲームプログラミングワークショップ2023論文集,2023,161-167 (2023-11-10)
https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=229361&item_no=1&page_id=13&block_id=8

参加報告

11/17-19に箱根で行われたゲームプログラミングワークショップ2023に学部四年生の佐藤岳大が参加しました。二日目にはポスターセッションで「人狼知能における占い師襲撃戦略の影響に関する考察」についての発表を行いました。

研究概要

多人数不完全コミュニケーションゲームである人狼を人工知能同士が対戦すると、人間がプレイする場合に比べて人狼陣営の勝率が著しく低いことがわかった。さらに分析を進めると、人狼の初日占い師襲撃の成功率が低さが、人狼陣営の勝率の低さに影響しているのではないかと推測できた。そこで、人工知能エージェントの人狼戦略を工夫することで人狼陣営が向上するか否かを検証した。人狼が行う戦略と狂人が行う戦略のどちらも明確な勝率の向上は見られなかったが、いくつかの興味深い発見が得られた。

ポスター

カテゴリー
研究

第50回ゲーム情報学研究会に参加

書誌情報

情報処理学会 研究報告ゲーム情報学(GI),2023-GI-50(8),1-6 (2023-07-01) , 2188-8736

https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=226815&item_no=1&page_id=13&block_id=8

参加報告

7/7-8に広島で行われた第50回ゲーム情報学研究会に学部四年生の佐藤岳大が参加しました。二日目には「相手手札の推定の利用したUNOゲームプレイヤ構築の試み」という題目で発表を行いました。

研究内容

手札に関する情報が不完全なゲームであるUNOは、モンテカルロ法の有効性が認められており、大貧民と同じように手札推定によってプレイヤの強さが向上するのではないかと考えた。そこで本研究では、相手の出せなかった手札を出せなかった時点の手札枚数と紐付けて保存し、その情報をモンテカルロ法のシミュレーションに応用した手札推定手法を用いることでプレイヤの強さが向上するかを検証した。検証の結果、手札推定によって色に関しては推定精度が向上したが、勝率に明確な差は見られなかった。

提案手法概観

あとがき

GPW2023の懇親会にて今回の発表が優秀発表賞として表彰されました。これからも精進して参ります。

https://www.ipsj.or.jp/award/gi-award3.html#:~:text=%E3%82%BF%E3%82%A4%E3%83%88%E3%83%AB-,%E7%AC%AC50%E5%9B%9E%E7%A0%94%E7%A9%B6%E4%BC%9A,-%E4%BD%90%E8%97%A4%20%E5%B2%B3%E5%A4%A7

カテゴリー
研究

 第18回NLP若手の会シンポジウムに参加

2023年8月29 ~ 31日で開催された「第18回 NLP若手の会 シンポジウム(YANS)」に学部4年生の尾崎慎太郎が「国会議事録を用いた政党のスタンス分析に向けて」というタイトルでポスター発表をしました。


ポスターの情報

尾崎慎太郎, 横山大作. 国会議事録を用いた政党のスタンス分析に向けて. 第18回NLP若手の会 シンポジウム(YANS), 2023/08. 
@inproceedings{ozaki_yokoyama_2023,
  author    = {尾崎慎太郎 and 横山大作},
  title     = {国会議事録を用いた政党のスタンス分析に向けて},
  booktitle = {第18回NLP若手の会 シンポジウム(YANS)},
  year      = {2023},
  month     = {08},
}

PDFはこちら

発表に関して

発表者は「国会議事録を用いた政党のスタンス分析に向けて」というタイトルでポスター発表を行いました。

若者の政治に対する関心の不足は、現代社会における重要な問題の一つです。それを解決するために、ユーザが扱いやすく、政治の内容を分かりやすく可視化することが目標です。

国会議事録APIを利用して取得した議事録データから、人手で賛否ラベルを付与します。そこから政党、年代、議案、発言内容と賛否ラベル含むコーパスを構築し、言語モデルをFine-Tuningすることにより文書分類モデルを開発しました。

議事録コーパスの作成

結果としては、発表段階の精度は6割ほどでまだまだ改善の余地があると考えます。具体的に、とあるテーマに対して9割の政党が賛成、1割が反対を示したとき、開発したモデルは1割の意見を理解しているかがわかりませんでした。

このプロジェクトの成果は、若者の政治理解を深める手段として利用されることを期待しています。そして、今後の展望として、より高い精度を持つモデルの構築を目指して研究を続けていく予定です。

発表したポスターはこちらのリンクをたどってください。

NLP若手の会 シンポジウム
カテゴリー
研究

研究室公開@2023年オープンキャンパス

2023年8月6日、7日の2日間、明治大学生田キャンパスのオープンキャンパスが行われました。本研究室は情報科学科の研究室紹介ツアーで見学できるルートの1つになり、2日間で450人程度の方に見学いただきました。多数の方に興味を持っていただき、感謝いたします。当日の配布資料はこちらです。

カテゴリー
研究

プログラミングコンテスト”ALGORI”決勝大会参加

学部3年生の佐藤岳大が、カードゲーム「UNO」をプレイするプログラミングコンテストALGORIに参加し、2023年3月25日開催の決勝戦に進出しました。

予選リーグでは安定した高得点を獲得して決勝大会に進出しましたが、準決勝Bブロックで惜しくも敗退しました。

作成したエージェントの詳細については、後日研究報告を行う予定です。