写真を完全にリアルなビデオに変換します – SMARTmania.cz

1713532105
2024-04-19 09:02:00

  • マイクロソフトは、一般公開したくないほど優れた人工知能を導入しました
  • 必要なのは、1 枚の写真と音声を組み合わせるだけで、リアルな「トーキングヘッド」が完成します。
  • 大量のコンテンツの洪水に備えるだけでなく、ディープフェイク動画に関する潜在的な問題にも備えましょう

Microsoft は、1 つの写真と音声ファイルから非常にリアルなビデオを作成できる新しい人工知能モデル VASA-1 を開発しました。

影響力の新時代?

テクノロジー大手は、新しい AI モデルが唇の動きや顔の表情を音声と同期させ、生成されるビデオの自然さを大幅に向上させたと発表しました。 しかし、「怠惰な」インフルエンサーはおそらくここで多くの利益を得ることはないだろう。Microsoftは、VASA-1を商用製品またはAPIとしてリリースする計画はなく、その代わりに仮想キャラクターを作成するためにこのテクノロジーを使用することに重点を置いていると述べているからである。

Microsoft Vasa は驚異的な人工知能で、写真をリアルなビデオに変換します。

しかし、他の企業も同様のテクノロジーを「利用」しているという事実は変わりません。一般的に、VASA-1 に関係なく、とにかく「写真のインフルエンサー」に向かっています。

写真一枚で本当に十分です

VASA-1 は 512 x 512 ピクセルの解像度で動作し、ビデオ生成プロセスの開始時に発生する遅延を最小限に抑えて、最大 40 フレーム/秒でビデオを生成できます。 このモデルを使用すると、ユーザーは主な目の方向、頭の距離、表情など、ビデオのさまざまな側面を調整できます。 これらの機能により、ユーザーはビデオの外観とダイナミクスを正確に制御できます。

Microsoft によると、VASA-1 モデルは芸術的な写真、歌ったオーディオ クリップ、英語以外のスピーチを使用したビデオの生成に成功し、標準的なプログラミングを超えて学習し適応するモデルの能力を実証しました。 サンプル動画も多数視聴できます ここ

大きな可能性、さらに大きな懸念

インフルエンサーシップの有望な利用と一種の民主化にもかかわらず、人工知能によって生成されたこのようなリアルなビデオの開発は、当然のことながら、特に欺瞞的なディープフェイクコンテンツの作成における悪用の可能性についての大きな懸念も引き起こします。 このようなものの悪用の可能性について推測する必要はありません。政治家から有名人、さらにはネットいじめに至るまで、事実上あらゆるものが自動的に提供されます。

幸いなことに、Microsoft はこのことを認識しており、教育ツールの改善、アクセシビリティの向上、治療サポートの提供など、責任ある開発とプラスの影響に重点を置くと主張しています。

Microsoftはまた、この技術が偽ビデオの検出の進歩に貢献する可能性があることを示唆した。 その結果、他人のテクノロジーを使用して写真と少しの音声から独自の仮想インフルエンサーを作成することになる可能性がありますが、Microsoft のテクノロジーはそれを悪用しないように配慮します。

記事の著者

アダム・ホモラ

私は幼い頃から新しいテクノロジーに魅了されてきました。 時間が経つにつれて、ゲームとゲーム業界に対する私の長期的な関心は自然にハードウェア、ソフトウェア、インターネット サービス、そして 2022 年からは人工知能にも加わりました。

#写真を完全にリアルなビデオに変換します #SMARTmania.cz

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick