Google DeepMind の最新 AI エージェントが「Goat Simulator 3」のプレイを学習

1710402281
2024-03-13 14:00:00

「SIMA はさらに一歩進んで、新しいゲームに対するより強力な一般化を示しています」と彼は言います。 「環境の数はまだ非常に少ないですが、SIMA は正しい方向に進んでいると思います。

新しい遊び方

SIMA は、DeepMind が、同社が過去に開発した AI テクノロジーであるゲーム プレイング エージェントに新たなひねりを加えていることを示しています。

DeepMind が Google に買収される前の 2013 年、ロンドンに本拠を置く新興企業 テクニックを披露した 呼ばれた 強化学習これには、パフォーマンスに関する正および負のフィードバックを使用してアルゴリズムをトレーニングすることが含まれており、コンピュータがクラシックなゲームをプレイできるようになる可能性があります。 アタリのビデオゲーム。 2016 年に、Google の一部として、DeepMind は アルファ碁、同じアプローチを使用したプログラム 囲碁の世界チャンピオンに勝つ、繊細で本能的なスキルを必要とする古代のボードゲーム。

SIMA プロジェクトでは、Google DeepMind チームはいくつかのゲーム スタジオと協力して、以下を含む 3D 環境で 10 種類の異なるゲームをプレイしている人間からキーボードとマウスのデータを収集しました。 ノーマンズスカイ取り壊すハイドロニーア、 そして 満足。 DeepMind はその後、そのデータに説明的なラベルを追加して、クリックやタップをユーザーがとったアクション (たとえば、ジェットパックを探しているヤギなのか、金を掘っている人間なのかなど) に関連付けました。

人間のプレイヤーから収集されたデータは、現代のチャットボットを強化する種類の言語モデルに入力されました。チャットボットは、テキストの巨大なデータベースを消化することで言語を処理する能力を獲得しました。 SIMA は、入力されたコマンドに応答してアクションを実行できるようになります。 そして最後に、人間がさまざまなゲーム内で SIMA の取り組みを評価し、そのパフォーマンスを微調整するために使用されるデータを生成しました。

SIMA AI ソフトウェアは、3D 環境を特徴とする 10 種類のゲームをプレイした人間からのデータを使用してトレーニングされました。

Google DeepMind のご厚意により提供

こうした訓練を経て、SIMA は人間のプレイヤーが与える何百ものコマンドに応じて、「左に曲がれ」、「宇宙船に行け」、「門を通れ」、「木を切り倒せ」などのアクションを実行できるようになりました。 」 このプログラムは、探索から戦闘、道具の使用に至るまで、600 を超えるアクションを実行できます。 研究者らは、GoogleのAIに関する倫理ガイドラインに沿って、暴力的なアクションをフィーチャーしたゲームを避けた。

「これはまだ研究プロジェクトにすぎません」と、Google DeepMind チームのもう 1 人のメンバーである Tim Harley 氏は言います。 「しかし、いつか SIMA のようなエージェントがあなたや友人とのゲームで一緒にプレイすることも想像できるでしょう。」

ビデオ ゲームは、AI エージェントにタスクを実行させる比較的安全な環境を提供します。 エージェントが有益な事務作業や日常の管理業務を行うには、エージェントの信頼性がさらに高まる必要があります。 DeepMind の Harley 氏と Besse 氏は、エージェントの信頼性を高める技術に取り組んでいると述べています。

2024 年 3 月 13 日午前 10 時 20 分 (東部標準時) に更新: Linxi “Jim” Fan からのコメントを追加しました。

#Google #DeepMind #の最新 #エージェントがGoat #Simulator #3のプレイを学習

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick