米研究者が PokeLLMon 開発:AI がポケモンバトル

LLMによるポケモンバトルでの人間並みのパフォーマンス達成

ポケモンバトルにおいて人間と同等のパフォーマンスを実現したエージェント、POKELLMON の紹介です。この研究は、テキストベースのフィードバックを用いたコンテキスト内強化学習、外部知識を使用した幻覚対策の知識拡張生成、強力な対戦相手に対するパニックスイッチングを避ける一貫性のあるアクション生成、という3つの戦略を組み合わせることで、人間のような戦略的能力を実現しました。

LLM_attrition_strategy.gif

主な成果

  • オンラインバトルでの実績: POKELLMONは、ネット上で公開している非公式の対戦シミュレーター「Pokemon Showdown」を使って、競争で 49 %、招待戦では 56% の勝率を達成しました。 Performance-of-prompting-approaches-in-battles-against-the-bot.webp PokeLLMon-against-human-player.webp
  • 戦略的能力: このエージェントは、ポケモンバトルの戦術的なゲームにおいて、人間らしい戦略を実行する能力を示しています。

技術的アプローチ

  1. コンテキスト内強化学習: テキストベースのフィードバックを活用し、ポリシーを洗練させます。
  2. 知識拡張生成: 外部の知識を組み込むことで、生成時の幻覚を防ぎます。
  3. 一貫性のあるアクション生成: 強力な対戦相手に対しても、パニックに陥ることなく一貫した行動を取ることができます。

pokemon_battle_framework.webp

今後の展望

POKELLMON の成功は、大規模言語モデル(LLM)を戦術的バトルゲームに応用する可能性を示しています。また、LLM における幻覚や一貫性のないアクション生成といった課題への取り組みに対する洞察も提供しています。

この技術的進歩は、AI の戦略的思考能力の発展において、重要な一歩を示しています。

元論文:PokéLLMon: A Human-Parity Agent for Pokémon Battles with Large Language Models
Github: https://github.com/git-disl/PokeLLMon?tab=readme-ov-file

関連投稿

ASML が展開する革新的なブランドフィルム: AI 技術で創り出された未来のビジョン

半導体製造装置メーカーである ASML が、2024 年のブランドフィルムを公開しました。今回のフィルムの特徴は、AI 技術を活用して生成されたことにあります。 このビデオは、Midjourneyを用いて 1,963 個のプロンプトから 7,852 枚の画像を生成し、900 台以上のコンピュータで編集されました。また、Runway

ASML が展開する革新的なブランドフィルム: AI 技術で創り出された未来のビジョン 続きを読む

OpenAI、ChatGPTアプリをApple Vision Proヘッドセット向けにリリース! インテリジェントな対話の新境地へ

OpenAIは、2024年2月7日、Xプラットフォームにて、ChatGPTアプリのApple Vision Proヘッドセット向けリリースを発表しました。ユーザーは、visionOS App Storeからアプリをダウンロードできます。 ### アプリの特徴 I.AIが公式発表とApple App Storeの情報を参照したところ、アプリのvisionOSプラットフォームにおける表示はiPa

OpenAI、ChatGPTアプリをApple Vision Proヘッドセット向けにリリース! インテリジェントな対話の新境地へ 続きを読む

Bard から Gemini へ:新しいモバイルアプリと先進的な Ultra 1.0 を搭載した有料プラン Gemini Advanced の展開

昨年 Bard を立ち上げて以来、世界中の人々が AI とまったく新しい形で協力し、仕事の面接の準備、コードのデバッグ、新しいビジネスアイデアのブレインストーミング、または先週発表したように、魅力的な画像の作成に利用してきました。 Bard のミッションは常に、私たちの AI モデルへの直接アクセスを提供することでした。Gemini は、私たちが提供する最も能力の高いモデルファミリーを代表しま

Bard から Gemini へ:新しいモバイルアプリと先進的な Ultra 1.0 を搭載した有料プラン Gemini Advanced の展開 続きを読む