バズ
- ■
- ■
出版社は、GPT-4が内容を「記憶」し、百科事典の項目と定義のほぼそのままのコピーをオンデマンドで出力すると主張している。
- ■
- ■
これは、確立されたリファレンス発行者が厳選されたコンテンツを AI トレーニングのスクレイピングから保護できるかどうかの重要なテストケースとなる
これは、あちこちにあるいくつかの断片だけの話ではありません。出版社らは、OpenAIが大規模なコピーのパターンに関与し、慎重に厳選された参考資料をスクレイピングして、ChatGPTが非常に権威があるように見える知識ベースを構築したと主張している。ユーザーが ChatGPT に情報を求めると、Britannica と Merriam-Webster が作成と事実確認にリソースを費やしたコンテンツを厳密に反映した (場合によっては一字一句) 回答が得られることがよくあります。
タイミングはこれ以上に的確なものではありません。 OpenAI は最近、トレーニング データ ソースを正当化するために、News Corp や AP通信などの大手出版社とのライセンス契約を打ち切り、契約を締結しています。しかし、これらの合意は、同社がすでに大量の Web コンテンツ (訴状によれば、商用 AI トレーニングに無料で使用できるはずのないプレミアム参考資料を含む) でモデルをトレーニングした後に締結された。
#ブリタニカChatGPTの記憶コンテンツを巡ってOpenAIを提訴