1771327727
2026-02-12 19:42:00
木曜日、Googleは、「商業的動機を持つ」攻撃者が、Gemini AIチャットボットに指示を与えるだけで、そのチャットボットから知識を複製しようとしたと発表した。伝えられるところによると、ある敵対的セッションにより、英語以外のさまざまな言語でモデルが 100,000 回以上実行され、表面上は安価な模倣者をトレーニングするために応答が収集されました。
Googleは、自社製品に対する脅威に関する四半期ごとの自己評価に相当する調査結果を公表したが、これは同社を被害者と英雄に仕立て上げたもので、こうした自己評価では珍しいことではない。 Google はこの違法行為を「モデル抽出」と呼び、知的財産の盗難とみなしています。Google の LLM がインターネットから許可なく収集された素材から構築されていることを考えると、これはやや重い立場です。
Google も模倣行為には無縁ではありません。 2023 年、The Information は、Google の Bard チームが、ユーザーがチャットボットの会話を共有する公開サイトである ShareGPT からの ChatGPT 出力を、独自のチャットボットのトレーニングに使用したとして告発されたと報じました。影響力のある BERT 言語モデルを作成した Google AI 上級研究者のジェイコブ・デブリン氏は、これが OpenAI の利用規約に違反していると指導部に警告し、その後辞任して OpenAI に参加しました。 Googleはこの主張を否定したが、データの使用を停止したと伝えられている。
それでも、Googleの利用規約は、この方法でAIモデルからデータを抽出することを禁じており、この報告書は、ややいかがわしいAIモデル複製戦術の世界への窓となる。同社は、犯人の多くは競争力を求める民間企業や研究者であると考えており、攻撃は世界中から行われていると述べた。 Googleは容疑者の名前を明らかにすることを拒否した。
蒸留との取引
通常、業界では、以前のモデルの出力に基づいて新しいモデルをトレーニングするこの手法を「蒸留」と呼び、次のように機能します。独自の大規模言語モデル (LLM) を構築したいが、Google が Gemini のトレーニングに費やした数十億ドルと数年の作業が足りない場合は、以前にトレーニングした LLM をショートカットとして使用できます。
#Googleによると攻撃者はGeminiのクローン作成を試みる際に10万回以上プロンプトを送った