7月13日、ELYZAはメディア向けに「言語生成AIの現状・課題・展望に関する勉強会/発表会」を開催。自社独自のLLMを開発するための支援プログラムの提供開始を発表した。
同社 代表取締役である曽根岡侑也氏は冒頭、言語生成AIの現状について歴史的な遷移を振り返りつつ、今後起こりうる生成AIの進化について仮説ベースで解説。ChatGPTのGPT-4では画像での利用が進むことや、Google Workspaceでは自然言語でプレゼンテーションを作成できる可能性があることを挙げた。さらに、テキストでの抽象的な指示によって行動設計をして動き出す生成AIの研究が進んでいることから、物理世界で生成AIが行動可能になる可能性などを示唆した。
LLMを取り巻く全体的な企業動向も説明。曽根岡氏は、社会実装に特化する動きとLLMの独自モデルを開発する動きが活発化していると指摘する。LLMを社会実装する動きは次の4ステップだとして、それぞれのステップで企業の取り組みを例に挙げつつ、サービスの開発・提供が進んでいる現状を解説した。
独自のLLMを開発する企業ドメインの特徴としては以下の3点が考えられるという。
曽根岡氏は、独自LLMを開発するには、Pre-Training(事前学習)とPost-Training(事後学習)が必要となると話す。特にPost-Trainingにおける追加トレーニングや基盤となる事前学習済みモデルのアップデートなど、精度向上に向けた恒久的な研究開発が重要だとした。
ELYZAでは、2022年11月よりPost-Trainingの研究を進め、独自のPost-Training基盤(個社データを整備・作成し学習する基盤)を構築。データ加工の技術や知見の獲得にも注力したという。加えて、実際に人間が入力することでしか得られない学習用データを、多様かつ大量に収集するためのチャット形式のアプリケーション基盤も保有している。これらを企業向けに提供することで、Post-Trainingによる独自LLM開発の支援を行っていくとした。
【関連記事】
・ELYZAとマイナビ、平均30%の業務効率化に成功 原稿作成に言語AIを活用
・「ChatGPT/GPT-4に関する通説と実態が乖離」ELYZAが大規模言語モデルの現況を語る
・ELYZAが、企業向け日本語AIサービスを発表 APIに加え、クラウドサービスでも提供へ