世界

ロボットのトレーニング時に音声データを追加すると、ロボットの作業効率が向上する

7月 8, 2024 / nipponese

1720410554
2024-07-05 14:00:01

ワイピング評価。上: さまざまなテスト シナリオ。下: 一般的な失敗ケースとタスクの成功率。 [Vision only] このポリシーでは、適切な接触を維持できないことがよくあります (例: 幅広に強く押しすぎたり、浮いたりする)。 [MLP fusion] この政策は、抽選を完全に消し去って早期終了することに失敗することが多い。クレジット: arXiv (2024年)。 DOI: 10.48550/arxiv.2406.19464

スタンフォード大学とトヨタ研究所のロボット工学者による合同チームは、ロボットを訓練する際に視覚データに音声データを加えると、ロボットの学習能力が向上することを発見した。チームは、 研究arXiv プレプリントサーバー。

研究者らは、AI ベースのロボットで行われるトレーニングのほとんどが、大量の視覚情報にロボットをさらすことで、関連する音声を無視していると指摘した。ロボットにマイクを追加し、何かが行われているときにどのような音がするべきかに関するデータを収集できるようにすることで、ロボットがタスクをよりよく学習できるのではないかと考えた。

例えば、 ロボット ロボットはシリアルの箱を開けてボウルに詰める方法を学ぶはずなので、箱を開ける音やシリアルがボウルに流れ落ちるときの乾いた感じを聞くと役に立つかもしれない。それを調べるために、研究チームはロボット学習の実験を4つ設計し、実行した。

最初の実験では、ロボットにヘラを使ってフライパンの中のベーグルをひっくり返すことを教える。2 番目は、ロボットに消しゴムを使ってホワイトボードの絵を消すことを教える。3 番目は、カップに入れたサイコロを別のカップに注ぐこと、4 番目は、3 つのサンプルから適切なサイズのテープを選び、それを使ってワイヤーをプラスチックの細片にテープで留めることである。






実験はすべて、つかむための爪を備えた同じロボットを使用して行われました。また、すべての実験は、ビデオのみを使用する方法と、ビデオと音声を使用する方法の 2 通りで実施されました。研究チームは、テーブルの高さ、テープの種類、ホワイトボード上の画像の種類など、指導とパフォーマンスの要素も変化させました。

すべての実験を終えた後、研究者たちはロボットがどれだけ早く簡単にタスクを学習し実行できたか、またその正確さを判断して結果を比較しました。その結果、音声を追加すると一部のタスクでは速度と正確さが大幅に向上しましたが、他のタスクではそうではないことがわかりました。

例えば、サイコロを振る作業に音声を加えると、ロボットがサイコロが落ちているかどうか判断する能力が劇的に向上した。 サイコロ カップの中にベーグルを入れました。また、独特の音が鳴るので、ロボットは消しゴムに適切な圧力をかけているかどうかを理解するのにも役立ちました。一方、音を追加しても、ベーグルがうまくひっくり返されたかどうか、またはホワイトボードから画像がすべてうまく削除されたかどうかを判断するのにはあまり役立ちませんでした。

研究チームは、この研究によって、音声を追加すると 教える AI ロボット向けの素材は、一部のアプリケーションではより良い結果をもたらす可能性があります。

詳しくは:
Zeyi Liu 他「ManiWAV: 野生のオーディオビジュアルデータからロボット操作を学習」 arXiv (2024年)。 DOI: 10.48550/arxiv.2406.19464

プロジェクトページ: mani-wav.github.io/

ジャーナル情報:
arXiv


© 2024 サイエンスXネットワーク

引用: ロボットのトレーニング時に音声データを追加すると、ロボットの作業効率が向上する (2024 年 7 月 5 日) 2024 年 7 月 7 日に https://techxplore.com/news/2024-07-adding-audio-robots-job.html から取得

この文書は著作権の対象です。個人的な学習や研究を目的とした公正な取り扱いを除き、書面による許可なしに複製することはできません。コンテンツは情報提供のみを目的として提供されています。

#ロボットのトレーニング時に音声データを追加するとロボットの作業効率が向上する