記事

AIで「パックマン」の史上最高スコア記録 マイクロソフト研究者

Alex Knapp ,Forbes Staff

マイクロソフトが買収したディープラーニングのスタートアップ、Maluubaの研究チームが伝説のゲーム「ミズ・パックマン(Ms. Pac-Man) 」で、史上最高スコアを叩き出す人工知能システムの開発に成功した。

ディープラーニングを活用してゲームを攻略するプログラムは、これまでにも存在した。しかし、Maluubaの試みにはいくつかの注目すべき側面がある。

まず、第一にあげられるのが、攻略対象となったゲームのユニークさだ。1980年代のアーケードゲームは本来、ユーザーが打ち負かすように設計された訳ではない。むしろ、人々が長い間楽しめるように作られており、特に今回の「ミズ・パックマン」はオリジナルのパックマンの強化版であり、通常よりも複雑なゲームになっている。

二点目は研究者らが攻略に用いたアプローチの独自性だ。攻略にあたり研究チームは単一のエージェントがゲームを学習する従来のモデルではなく、複数のシンプルなエージェントが個別の課題を解決するモデルを採用した。例えて言うと、お化けの行動を学習するエージェントやフルーツの行動を学習するエージェント、ペレットの行動を学習するエージェントといった具合に、複数のエージェントが並列的に学習を行うのだ。

合計で100以上のエージェントが独自の視点からミズ・パックマンがとるべき行動パターンを設計した。研究チームはそこから生まれた複数の行動パターンを集約し、各自に平均的重み付けを行った上で、プログラムを動作させた。

「課題をバラバラにして処理することで、学習をより容易に行うことができた」と、研究チームは動画で述べている。「単一のエージェントが非常に複雑な課題を解き明かすのではなく、複数のエージェントがシンプルなタスクの処理にあたる仕組みをとったのです」

複雑な課題をシンプルで、小さなタスクに分割して処理することで、ディープラーニングシステムはより複雑な問題を扱えるようになると研究チームは考えている。この考え方は、ゲームだけでなく将来的にAIが処理を担うことになる様々な現実世界の課題に適用可能なのだという。

「一つの問題を2つや3つに分けるだけで、取り扱う課題の複雑性は大幅に低下する」と研究者らは述べている。

今回の研究結果はユーチューブ上に動画で公開されており、その内容を詳細に記したドキュメント「Hybrid Reward Architecture for Reinforcement Learning」もウェブ上で公開中だ。

編集=上田裕資

あわせて読みたい

「AI」の記事一覧へ

トピックス

ランキング

  1. 1

    野田聖子氏の文春砲を扱わないTV

    小林よしのり

  2. 2

    「米は北攻撃できない」は本当か

    自由人

  3. 3

    北におびえ足並み乱す韓国大統領

    NEXT MEDIA "Japan In-depth"

  4. 4

    元TBS記者の不起訴に異常な警察

    猪野 亨

  5. 5

    山尾議員の不倫相手は恥だと思え

    小林よしのり

  6. 6

    米国空軍のB1爆撃機が怖い北朝鮮

    和田政宗

  7. 7

    共産党のデマがはびこる堺市長選

    足立康史

  8. 8

    松本人志マッチョ化は典型的変節

    文春オンライン

  9. 9

    よしのり氏 山尾氏の謝罪に苦言

    小林よしのり

  10. 10

    「脱デフレは幻想」イオンが証明

    近藤駿介

ランキング一覧

ログイン

ログインするアカウントをお選びください。
以下のいずれかのアカウントでBLOGOSにログインすることができます。

コメントを書き込むには FacebookID、TwitterID のいずれかで認証を行う必要があります。

※livedoorIDでログインした場合、ご利用できるのはフォロー機能、マイページ機能、支持するボタンのみとなります。