オープンソースAIに舵を切ったIBM
OpenAI、Microsoft、Google、Amazonを筆頭に、生成AIの頂上対決が活発に繰り広げられている。言語モデル(LLM)の進化や、NVIDIAに代表されるGPU半導体の発展、さらにデータセンターなどのインフラ分野への注目度も高まっている。一方、かつては「Watson」でAIの世界を牽引していたIBMは、こうした生成AIのブームの中で存在感が薄れがちだった。しかし、2023年の「IBM watsonx」の発表以来、次々と新たな取り組みを発表し、企業向けAIの分野で再び存在感を示しつつある。特筆すべきは、今年開催された「THINK 2024」で、IBMがAI分野において「オープンソース」戦略へと舵を切ったことである。
オープンソースは、ソフトウェア開発の世界では広く認知されているが、生成AIの分野、特に大規模言語モデル(LLM)の開発においては、これまで限定的だった。MetaのLlamaやDatabricksのDolly、イーロン・マスク氏の「xAI」が公開した「Grok」などのオープンなLLMが登場してきているが、これらはダウンロードして自社用のAIとして導入できるというもの。LLMの中身そのものは企業が非公開で行っており、ユーザーがモデルの拡張を行うことは出来ない。
これに対してIBMは、本格的なオープンソース化こそがAIの発展と企業への導入を加速させる鍵になると考え、5月に米国で開催された「Think 2024」でオープンソースを軸にしたAI戦略を打ち出した。その中核となるのが、IBM独自の基盤モデルとして提供する「Granite」と、モデルを継続して拡張できるオープンな仕組みとしてRed Hatと進める「InstructLab」である。
オープンコミュニティベースで基盤モデルを拡張していくとはどういうことか。IBMフェローでコンサルティング事業本部CTOを務める二上哲也氏は、「オープンコミュニティの力を結集してモデルを進化させ、それを各社が取り込み自社専用の信頼できる基盤モデルとすること」と語る。IBMはオープンソースのカルチャーとエコシステムを、AIの世界にも持ち込もうとしているのである。
InstructLabがもたらすインパクト
InstructLabは、IBMが開発した大規模言語モデルの事後学習を効率化するフレームワークだ。「IBMリサーチが開発を行い、Red Hatとオープンソースとして育て公開した」と同社AIエバンジェリストの田中孝氏は語る。
事後学習とは、汎用的な知識を持つ基盤モデルに、特定のタスクに特化した知識を追加学習させるプロセスであり、モデルを企業の業務に適したものにカスタマイズするために重要な役割を果たす。
InstructLabは、この事後学習において、効率的に質問と回答のペアを作成し、追加学習を行うための仕組みである。学習させたい知識やスキルをタクソノミーで定義し、サンプルデータを与えて教師モデルで合成データを作成する。別の批評家モデルで質問応答ペアの適切性を評価し、品質の高い学習データを使ってターゲットモデルを学習させる。この仕組みにより、学習データの収集と管理のハードルを下げることができる。
また、InstructLabでは、拡張したいスキルや知識をプル・リクエストという形で本体のリポジトリに登録し、コミュニティでモデルを育てていくことも可能である。企業内でベースラインモデルに独自の知識やスキルを追加していく学習サイクルにも活用できる。InstructLabは、コミュニティでモデルを育てる観点と、企業内でモデルを成長させ業務に貢献させる観点の両面において、大きなインパクトを与えられると考えられている。
従来の事後学習には、大量の学習データ収集とチューニングに多大な工数がかかるという課題があった。InstructLabは、この課題に対し、合成データ生成と不適切データ除去の機能を導入することで、少ないデータで効率的に学習を行うことを可能にする。
IBMの社内検証では、InstructLabを用いることで、従来の9ヵ月/14回イテレーションの学習プロセスを、わずか1週間/1回イテレーションで上回る精度を達成したという。
テクノロジー事業本部データ&AIエバンジェリストの田中崇氏は、InstructLabの意義を次のように説明する。
「InstructLabは、企業の壁を越えてモデルを育てるコミュニティアプローチ。各企業がInstructLabを使って追加学習を行い、その成果をオープンなコミュニティに還元することで、互いの知見を共有しながら、コミュニティ全体でモデルを洗練させていくことができる。コミュニティでのオープンなモデル開発と、企業内での継続的なモデル改善の両方を加速させる仕組みです」(田中氏)
Graniteがもたらすオープンなエコシステム
InstructLabを支えるオープンな基盤モデルが、IBM Graniteだ。Graniteは、IBMが独自に開発した大規模言語モデルであり、最先端の自然言語処理技術が詰め込まれている。そして、IBMはこのGraniteのソースコードをApache 2.0ライセンスで公開することを決定した。これにより、誰もがGraniteを自由に利用、改変、再配布できるようになる。
二上氏は、「Graniteのソースコードとモデルを公開することで、パートナー企業や開発者コミュニティとのオープンなAIエコシステムを築いていきたい」と語る。実際、すでにAWS、Microsoft、Adobe、Salesforceなど、多くのAIプラットフォームやSaaSベンダーがGraniteとの連携を表明している。日本企業がGraniteを自社製品に組み込むことも可能だ。
このように、IBMは、GraniteとInstructLabの組み合わせにより、オープンなAIエコシステムを形成しようとしている。それは、オープンソースソフトウェアの世界で実現されてきたカルチャーを、AIの分野にも取り入れる試みだ。