マイクロソフト、写真を「話す顔」に変えるAIを開発

1713576407
2024-04-20 01:26:44

AI の巨人は決して革新を止めません。 マイクロソフトの研究者が開発した 人工知能 (AI) テクノロジー IT大手が今週公開した文書によると、これは顔の写真と音声サンプルを「話している顔」の超リアルなビデオに変換するという。

同社は「誤解を招いたり欺いたりすることを目的としたコンテンツを作成することが目的ではない」と明言しているが、「他のコンテンツ生成技術と同様に、人間になりすますために不適切に使用される可能性がある」ことを認識している。 生成型 AI の急速な台頭これにより、驚くべき品質のあらゆる種類のコンテンツ (テキスト、画像、音声など) を簡単に作成できるようになりますが、実際、特に詐欺や偽情報の目的での悪用に関して多くの懸念が生じています。

「私たちの研究は、ポジティブなアプリケーションを視野に入れて、(…) 仮想アバターに焦点を当てています」と Microsoft は断言します。 「私たちは、実在の人物から誤解を招くコンテンツや損害を与えるコンテンツを作成することを目的としたあらゆる行為に反対します。」 主要投資家であるIT企業OpenAI (ChatGPT)したがって、「テクノロジーが責任を持って現在の規制に従って使用されることが確認されるまで」、新しいツールを利用可能にしたり、技術情報を提供したりする予定はありません。

現場に立つ他の企業

VASA-1 と呼ばれるこのコンピューター プログラムは、単純なポートレート写真と音声ファイルを取得し、顔がアニメーションし、非常にリアルな方法で話すビデオに変換します。 オンラインに投稿された例(仮想キャラクターの画像から作成されたプレビュー)では、唇の動きが同期しており、顔の特徴は説得力があり、頭の動きは少しぎくしゃくしていますが、それでも印象的です。

Microsoft によれば、このテクノロジーの開発には「教育の公平性の向上、コミュニケーションが困難な人々のアクセシビリティの向上、必要な人々への治療サポートの提供など」の利点があるため、この研究を実施することが正当化されるとのことです。 、ビデオ用生成 AI の専門家の 1 つである Runway などの Google 研究者も、トーキングヘッドのリアルなビデオを生成できる AI モデル Vlogger を作成しました。

多くの当局が生成型 AI の規制を検討しています。 欧州連合は12月に、 AIを規制する前例のない法案悪用の可能性を制限しながら、イノベーションを促進しようとしています。


#マイクロソフト写真を話す顔に変えるAIを開発

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick