決して存在しなかった犬: Google が新しい AI ビデオ作成ツールでソラに対応 | テクノロジー

1712665614
2024-04-09 12:03:31

戦略としてはまず、 マーケティング: まずニーズが生み出され、次にソリューションが販売されます。 Gmail、ドライブ、カレンダー、Meet、ドキュメントなどの Google 仕事ツールは 30 億人のユーザーによって使用されており、その多くは制限付きで無料です。 しかし、そのうち 1,000 万人 (40% が個人、60% が企業) が、これらのアプリケーションを使用して組織化するためにお金を払っています。 そして今、それらが何百万もの人々の日常生活の一部となり、ニーズが生み出され、このエクスペリエンスを向上させることを期待して人工知能が登場しました。 ただし、このソリューションは無料ではなく、追加の利点ごとに月額 10 ドル、約 9.2 ユーロの費用がかかります。 同社は今週火曜日にラスベガスでこの発表を行い、そこでデジタル革新を発表する年次総会を開催した(グーグルネクスト)。 その中で、多国籍企業の反応は、 Sora、オープン AI ツール 単純なテキストリクエストから高品質のビデオを作成できます。 答えは、Vids と呼ばれるオーディオビジュアル エディターです。 画像2Open AI の競合他社である Sora に似ています。

ほとんどのユーザーは、Google Workspace 仕事用プラットフォームに含まれる 11 個のアプリケーション(Gmail、ドライブ、カレンダー、チャット、ドキュメント、スプレッドシート、スライド、フォーム、サイト、Keep、Apps Script)の一部を、限られた範囲ではありますが、無料で使用しています。 月額 5.75 ユーロ (ビジネス ステーター)、11.50 ユーロ (スタンダード)、または 17.25 ユーロ (プラス) を支払う人もいます。 Google Cloud の CEO、トーマス クリアン氏は今週火曜日、この人気のある大規模なツール セットのリニューアルを発表しました。 Gemini のワークスペースGoogleの人工知能。

クリアン氏は、イノベーションはユーザーの需要に応えるものだと主張する。 同氏によると「7割がこの機能を利用している」 書くのを手伝ってください そして 75% がスライドでプレゼンテーションを作成しています。」 新しいもの 「Gemini を使用した Google Workspace の一連のイノベーションと改善」 会議とメッセージング用のプラグイン (月額 10 ドル) が含まれており、ChatGPT の有料版と同様に、会議のメモを取り、要約し、 チャット (関連チャットアプリ) 69言語の同時通訳も可能です。

さらに 10 ドルで、別のセキュリティ プラグインを使用すると、AI を使用して機密ファイルとデータを自動的に分類して保護できます。 Google Workspace の CEO、Aparna Pappu 氏によると、「大規模な言語モデルを使用すると、20% 多くの スパム [correo basura o no deseado] Gmail では、1,000 倍以上のユーザーからの苦情が毎日確認され、新たなハッキング攻撃への対応が 90% 早くなりました。 フィッシング [estafa por suplantación]”。

ビデオ

しかし、Google の大きな賭けの 1 つはビデオの作成を目的としています。 この意味で、作業プラットフォームには Google Vids アプリケーションも含まれており、プラットフォームの他のユーティリティと互換性のあるスクリプトの開発、オーディオビジュアルの制作、作成が可能になります。 「Workspace Labs で間もなく動画が公開される予定で、今年末までにすべての顧客がアクセスできるようにしたいと考えています」とクリアン氏は説明します。 「おそらく 6 月になるでしょう」と Google Workspace の CEO、Aparna Pappu 氏は言います。

「Vids は、ビデオ、ライティング、制作、編集アシスタントをすべて 1 つにまとめたものです。 簡単に編集可能なストーリーボードを生成でき、スタイルを選択した後、ストックビデオ、画像、BGM を含む提案されたシーンから最初のドラフトを作成します。 また、プリセットのナレーション音声を選択するか、ユーザー独自の音声を使用することで、適切なナレーション音声でメッセージを完成させることもできます」と Pappu 氏は説明します。

「必要なのはブラウザだけです。それが重要なポイントです」と指令は付け加えています。 「ファイルを電子メールでやり取りする必要はありません。 チームは、ワークスペース全体に対して同じアクセスとセキュリティ制御を使用して、同時にストーリーを続けることができます。

Vids の開始は、最初の段階では Google 購読者に限定されます。 「私たちは有料の顧客に展開し、彼らからフィードバックを得ています。 この製品は、作業環境を最優先して設計されています。 これらの機能を有料顧客に展開し、ユーザーからフィードバックを得たら、拡張することを検討します」と Pappu 氏は言います。

Google の Image 2 アプリケーションを通じて人工知能で作成された顔と手の画像。

ソラの前の画像2

Sora に最も近い開発も、 ジェミニ 1.5 プロ 開発者向けの Vertex AI プラットフォームを通じてプレビューで利用できるようになりました。 これは画像 2 です。Google Cloud ディレクターの Amin Vahdat 氏によると、AI モデルは次のようになります。 「開発者に世界最大のコンテキスト ウィンドウを提供します。」 「当社の画像モデル ファミリを使用して、電子透かしを含むテキスト メッセージから 4 秒のビデオを作成できるようになりました。」

「企業規模で高品質で正確なビデオを生成するために Image 2 を活用している組織が増えています。 「クリエイティブと マーケティング テキストメッセージからアニメーション画像を生成できます。 当初、ビデオは 24 フレーム/秒 (fps)、解像度 360×640 ピクセル、長さは 4 秒であり、継続的に改善する予定です」と Vahdat 氏は説明します。

このプログラムは、シーケンス全体の一貫性を維持し、セキュリティ フィルターや電子透かしを含め、さまざまなアングルやカメラの動きを提供するように準備されています。 SynthID (Google DeepMind))。 人工知能に関するヨーロッパの新しい法律では、創作物が人工知能によって生成されたものであることを明確に区別することが求められています。

また、更新されたバージョンでは、画像の不要な側面を削除したり、新しい要素を追加したり、境界線を拡張してより広い視野を作成したりすることも簡単になります。

こうした発展は、 Sora で AI の動きを開く、テキスト プロンプトから最長 1 分間のビデオを作成する人工知能モデル。 同社の説明によると、このオーディオビジュアルプロデューサーは、「損傷やリスクの重要な領域を評価」し、ビジュアルアーティスト、デザイナー、映画制作者から提案や提案を得るためにテストを受けています。

オープン AI は、その結果において素晴らしいリアリズムを提供するにもかかわらず、精度エラーや、オブジェクトの変更を伴うシーンが表示されるなどの幻覚など、「現在のモデルには弱点がある」ため、開発を見直す必要性を認識しています。ただし、次のフレームでは、無傷であるか、スペースが混在しているか、軌道が混乱しているように見えます。

フォローできます EL PAÍS テクノロジー フェイスブック y バツ または、ここからサインアップして私たちのメッセージを受け取ることができます ニュースレターセマナル


#決して存在しなかった犬 #Google #が新しい #ビデオ作成ツールでソラに対応 #テクノロジー

Related News

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick