Darío Gil、IBM Research: 「今年、ユースケースを備えたスペイン語初の人工知能モデルが登場します。」 | テクノロジー

1712572698
2024-04-08 03:20:00

IBMの副社長で同社のグローバル研究部門の責任者であるダリオ・ギル氏はこう語る。

人間の脳は既知の宇宙で最も複雑な自然構造であり、1 秒あたり 1,000 のインパルスを伝達する 860 億個のニューロンを備えています。 その並外れた生物学的機構の一部だけを模倣して、5 億人以上が話すスペイン語で学び、理解し、応答することは、政府から委託された記念碑的な任務であり、バルセロナ スーパーコンピューティング センター (BSC) は、MareNostrum スーパーコンピューターと多国籍の IBMこれにより、そのプログラミング、研究、およびグローバルな人工知能インフラストラクチャの可能性がすべてプロジェクトで利用可能になります。

ダリオ・ギルマドリッドで育ったムルシア人で、2024 年に 49 歳になる彼は、IBM のグローバル研究部門の責任者として、この冒険の主な技術的支援者です。 彼は、スペイン語で誕生した最初の主要な人工知能言語モデルを生み出す契約に署名した直後にこのインタビューに参加しました。 この進歩は指数関数的かつ確実なものであると確信しており、「革命」であると彼は宣言しています。議会の議事録から王立スペインアカデミー、スペイン語圏の大学やグループに至るまで、すべてが適合するオープンで協力的なアーキテクチャに取り組んでいます。 同氏は、今年最初の発展が見られると予想している。

聞く。 なぜIBMはスペイン語で人工知能に賭けているのでしょうか?

答え。 人工知能に関する私たちの視点により、政府の戦略と一致することができます。 私たちは、人工知能の未来は、他の企業とは対照的な、オープンなエコシステムを通じて創造され定義されるものであると強く信じています。 それは 20 年以上前のオペレーティング システムで発生し、当時はうまくいきました。 スーパーコンピューティングとインターネットなどのすべての分散システムの両方において、オペレーティング システムの将来はオープン ソースに基づくものになるだろうというのは、断固とした賭けでした。 私たちは同じ確信に達しており、コミュニティは人工知能の作成に参加したいと考えています。

P. 参加はどうなるのでしょうか?

R. 私たちは、事前トレーニングと方法論に使用されるデータに透明性がある、オープンソースに基づいた基礎モデルを開発するための共同環境を構築する予定です。 モデルの容量を慎重に毎日増やしていくことが非常に重要です。 既存の基本モデルには 6 ~ 9 か月の事前トレーニングが必要で、バージョンは年に 1 回リリースされます。 開発者コミュニティ全体、知識や機能を追加したいすべての人のための基本モデルがある場合は、協力してスペイン語と共同公用語で最高のオープンな基本モデルを作成します。

バブルがあれば大惨事になるが、人工知能の技術基盤は強力で強固である

P. どのように発展していくのでしょうか?

R。 コンピューティングの観点からは、BSC の既存の機能を使用します。 彼の MareNostrum には大臣からの約束があります [para la Transición Digital, José Luis Escrivá] のペースを加速するために投資を継続する マーレノストラム 5 6. 当社としては、人工知能と IBM Research の最新の進歩に特化したスーパーコンピューティング センターを提供します。

P. このモデルの対象となる優先分野は何ですか?

R. すべての皆様に向けてですが、政府は、この種のイノベーションを導入する際に大きな阻害や複雑性が存在する中小企業と国家行政が利益を得ることができるよう保証することに関心を持っています。 これら 2 つの分野で人工知能の普及を実装するためのユースケースを定義しました。

このモデルでは公的データが使用されますが、国が所有する文書を使用したいという要望もあり、これは非常にユニークで興味深い問題です。 すべての議会の討論の記録は一例です

P. いくらかかりますか?

R. 具体的な答えはありません。 ただし、これが近似値として役立つとすれば、高性能の基本モデルを作成するには、1 台あたり 35,000 ドルのコストがかかる数千のプロセッシング ユニットが必要であると言えます。 [32.300 euros] 最低限として。 これらは非常に野心的なプロジェクトです。 これは、ある午後に 2 人で話し合ったり、PowerPoint を作成したりするようなものではありません。 IBM Research には 3,600 の 科学者とエンジニア 参加者と、基礎モデルの作成に専念する独自のスーパーコンピューティング チームが参加します。 また、オープン システムであるため、参加を希望するスペイン語を話す開発者のコ​​ミュニティを追加する必要があります。 これらは並行して進められる取り組みです。

P. モデルにフィードするデータはどこから来るのでしょうか?

R. これは公的データになりますが、国の財産である文書を使用したいという要望があり、これは非常にユニークで興味深い問題です。 すべての国会討論の記録はその一例です。 しかし、国立図書館と王立スペインアカデミーの協力も予想されています。 公開されているデータになります。

アルゼンチンの経験と一致する答えをモデルに要求すると、モデルはそのように動作し、インタラクションが生成されたコンテキストから学習します。

P. そして、スペイン語話者の多様性はどのようにして保たれるのでしょうか?

R. 数学的な観点から見ると、非常に多様な言語を組み込むことができます。 多様性は同じニューラル ネットワーク内にあり、その後、 微調整 [ajuste o perfeccionamiento]は、基本文書でトレーニングされている場合でも、スペイン語のさまざまなバリエーションに適応します。 アルゼンチンの経験と一致する答えをモデルに要求すると、モデルはそのように動作し、インタラクションが生成されたコンテキストから学習します。

P. ただし、スペイン語の「約束をする」は、管理上の使用例を例に挙げると、一部のラテンアメリカ諸国では同じ意味を持たない場合があります。

R. 基本モデルは、特定のコンテキストを理解できるように、全員の努力によってスキルが向上し、専門化され、獲得されます。 オープンソース モデルでは、この膨大な多様性が可能になります。 そして目標は、ブラジルを含め、可能な限りそれを拡大することです。 イベロ・アメリカは機会が豊富な巨大市場であり、スペイン語の競争上の優位性を活用することが重要です。

目標は、ブラジルを含め、可能な限り拡大することです。 イベロ・アメリカは機会が豊富な巨大市場であり、スペイン語の競争上の優位性を活用することが重要です。

P. 最初のモデルはいつ発売されますか?

R。 目標は、今年何かを実行し、それと並行して、ほぼ同時期にいくつかのユースケースを開発することです。 この世界で [de la inteligencia artificial]これは非常に動的であり、何年もかかる期限には誰も興味がありません。

P. そしてIBMは何を得るのでしょうか?

R。 Red Hat の例を挙げます [multinacional de programación de código abierto cuya empresa matriz es IBM]。 毎年数十億ドルの請求を行っており、世界最大の企業です。 ソフトウェア 開ける。 このモデルは、機器と互換性のあるメンテナンスやセキュリティを必要とする企業や政府に対してプログラムを促進することを目的としています。 私たちはそのビジネスモデルに慣れています。 私たちがそれを行うのは、利他的だからではなく、そのモデルを信じているからです。 私たちは戦略的パートナーを求めており、スペイン政府と多くの共鳴を見出しています。 私たちの人工知能連合には、80 を超える機関がこの取り組みに参加しています。

P. 人工知能バブルは起こるのか?

R. テクノロジー自体は、他では見たことのないようなスピードで進化しています。 そして、私たちはもはや 1 年や 2 年の計画を立てるのではなく、1 か月、数週間、または数日後の計画を立てます。 泡が見えません。 もしあれば壊滅的ですが、技術基盤は強力で強固です。

フォローできます EL PAÍS テクノロジー フェイスブック y バツ または、ここからサインアップして私たちのメッセージを受け取りましょう ニュースレターセマナル

続きを読むには購読してください

無制限に読む

_


#Darío #GilIBM #Research #今年ユースケースを備えたスペイン語初の人工知能モデルが登場します #テクノロジー

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Recent News

Editor's Pick