中国がOpenAIツールと同様のテキストからビデオを作成できるSoraチャレンジャーを発表、ただしはるかに短い

1714395982
2024-04-29 13:00:26

中国は、次のような独自のテキストからビデオへの人工知能(AI)ツールを考案した。 OpenAI’s Sora、ただし、米国のサービスの60秒と比較して、新しいモデルは16秒以内のビデオしか作成できません。

ソラに追いつくためのこれまでのところ国内の最大の期待であるヴィドゥは、北京に本拠を置く名門清華大学との共同研究により、新興企業の盛州科技によって週末に立ち上げられた。

同社によれば、このモデルは単純なテキストプロンプトに基づいて1080p解像度のビデオを生成できるという。

「Viduは自立型イノベーションの最新の成果であり、多くの分野で画期的な進歩を遂げています」と、清華AI研究所の副所長でもあるShengshuの主任研究員であるZhu Jun氏は、中国の首都で開催された中関村フォーラムでこのモデルを発表し、こう語った。 、北京ニュースの報道によると。

Shengshu が公開したデモビデオのスクリーンショット。

Vidu は「想像力豊か」で、「物理世界をシミュレートでき」、「一貫したキャラクター、シーン、タイムラインを持つ 16 秒のビデオを作成できる」と Zhu 氏は述べ、このモデルは「中国の要素」も理解できると付け加えた。

モデルの発表中に、Shengshu は草の上に座ってギターを弾くパンダをフィーチャーしたものや、プールで泳ぐ子犬をフィーチャーしたものなど、いくつかのデモ クリップを公開しました。どちらも鮮やかなディテールを示しています。

Viduのデビューは、Microsoftが支援するOpenAIなど、世界の主要な生成AIプレーヤーに追いつこうと競っているこの国での期待を高めている。

2022年11月のローンチ後、多くの中国を拠点とする競合他社に影響を与えたOpenAIのChatGPTとは異なり、2月に公開されたSoraビデオのプレビューは、中国のビッグテック企業や新興企業から同様のレベルの熱意を集めていない。

業界専門家らは、中国企業の躍進を妨げる要因の一つは、十分なコンピューティング能力の欠如であると述べた。

ソラが 1 分間のクリップを作成するには、8 個のクリップが必要です Nvidia A100 グラフィックス プロセッシング ユニット (GPU) 北京を拠点にインテリジェント・コンピューティング分野で働く技術コンサルタント、リー・ヤンウェイ氏によると、このシステムは3時間以上実行されるという。

「Sora は推論に多くの計算能力を必要とします」と彼は言いました。

米国は、AI システムのトレーニング用コンポーネントとして非常に人気のある A100 GPU や H100 GPU など、Nvidia などが製造する先進チップの輸出規制を強化しているが、中国への出荷は禁止されている。

OpenAIのSora氏、中国のAIの夢に「冷水」をかける

北京に本拠を置くShengshuは2023年3月に設立され、コアチームのほとんどは清華大学AI研究所のメンバーのほか、アリババグループホールディング、テンセントホールディングス、バイトダンスのメンバーで構成されている。 ポスト社の所有者であるアリババも独自のビデオモデルに取り組んでいる。

Shengshu は先月、Qiming Ventures などの投資家から数億元を調達した。 志浦AI 新興データベースプロバイダーITjuziによると、Baidu Venturesとのことだ。

#中国がOpenAIツールと同様のテキストからビデオを作成できるSoraチャレンジャーを発表ただしはるかに短い

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick