3月16日、ELYZAはメディア向けに「国内言語AIの現状と展望に関する勉強会」を開催。ChatGPTをはじめとした大規模言語モデル普及の経緯や現況について解説が行われた。
はじめに、ChatGPTなどに注目が集まる現況について、「2022年11月30日にOpenAIから汎用的な対話AIが公開されたことを皮切りに、Microsoftが同社に追加出資をしている。Googleは約2ヵ月遅れる形で『PaLM API』提供の準備を進めており、AmazonやMetaなども競合サービスの提供に向けて動いている」とELYZA CEO 曽根岡侑也氏が切り出した。2023年3月15日には、改良された「GPT-4」が提供されており、より専門的な問題に対しても人間に近いレベルで回答ができる水準までに到達している。曽根岡氏は、GPT-4において“多言語での性能向上”に着目しているとして、日本語での利用において英語利用時を上回るようなパフォーマンスが出ていると指摘。また、画像による入力処理(マルチモーダル)にも対応しており、「これは急に起きた変化ではなく、4年ほどかけた成果だ」と曽根岡氏は述べる。
AI利用が活発化する転換点となったのが大規模言語モデル(LLM:Large Language Models)の登場であり、その時点では数万の教師データを用いて人間に近い精度をマーク。その後、事前学習により教師データなし、あるいは少量データでも自然なテキストを生成できるGPT-3が誕生し、今日のGPT-4に至っているとした。
具体的には、3年前にOpenAIが「Scaling Law」に関する論文を公開にあわせて、当時最大モデルの約10倍サイズで学習させたGPT-3を構築。テキストから簡単なWebサービスを自動生成できるようになるなど、世間に大きな衝撃を与えた。これを皮切りに競合サービスが次々に登場するようになると、ビッグテックと呼ばれる企業が独占することを嫌ったオープンソース化の動きも見られるようになったという。
曽根岡氏は「ChatGPT/GPT-4に関する通説と実態が乖離している現状が伺える」として、いくつかの例を示しながら説明した。たとえば、「自社業務の多くが代替できる」という通説に関しては、大規模言語モデルは一要素でしかなく、AI処理に関するフローやシステム、ユーザー体験の最適化が必要になると指摘。「重要なのは、利用して改善を重ねていくことであり、そのまま使うだけでは精度不足にもつながる」と説明する。一般的にタスクに特化させた強化学習を経ると精度が高くなる一方で、GPT-4においては一部の領域で強化学習を施したものよりも高い精度をマークしているとした。また、コスト面も考慮する必要があり、軽量のモデルを使うなどニーズにあわせた利用方法を考えることが大切だという。
さらに、「大規模言語モデルを日本でもいち早く作るべき」という意見については、市場競争に勝つためには慎重な議論が必要だとした。現在、大規模言語モデルを取り巻く市場構造は複雑化しており、NVIDIAなどのハードウェアメーカー、MicrosoftやAWSなどのクラウドプラットフォーマーの存在感が強く、コスト構造においても売上の10%から20%程度をそうしたインフラ側の大手企業に支払っているという。また、大規模言語モデルを提供する企業についてもOpenAIの一強と断じることができない状態にあり、今後ますます競争が激化していくとした。
なお、クラウドプラットフォーマー間の勝敗は決しているとして、Microsoft、AWS、Googleがリードしていく状況が続ける中で、日本はこれらのクラウドプラットフォーマーに依存する形になると指摘。さらに、AIモデルを使用するユーザーを囲い込む動きをOpenAIやGoogleが見せており、とりわけOpenAIとMicrosoftの動きが非常に俊敏だとして、「わずか4年でゼロから汎用的なモデルを開発しており、既にOpenAIは大きな成長サイクルに突入している。今からそこに追いつくことは厳しく、市場構造と競争環境を理解した上でどのようにポジションニングしていくか。そこが議論されるべきポイントだ」と説明する。
ELYZAとしては、AIの活用方法こそが要諦であり、早く高品質なAIの活用をサポートするための新規サービス「ELYZA App Platform」を提供すると発表。同サービスでは、AI処理フローやUIを備えた言語AIシステムを容易に構築することができるとして、最短1週間でプロトタイプシステムを用いた現場検証が可能になるとしている。なお、GPT系統のAIモデルや「ELYZA Brain」のような国産のAIモデルを活用可能であり、ニーズに応じた使い分けや組み合わせが可能だという。
また、JR西日本カスタマーリレーションズと言語AI導入プロジェクトを実施しており、顧客対応業務の半自動化に成功したことにも言及された。同社では、1日あたり約6,000件の問い合わせ対応が必要な状況にあり、スタッフの熟練性による対応品質のバラつきに課題を感じていたという。そこでELYZA BrainとGPT系統のモデル双方を用いた実装を行い、対応における文章作成などにおいて負荷を軽減。「副操縦士のように寄り添う形でAIがサポートしている」と曽根岡氏は説明する。最後に、言語AIは「作る」から「選ぶ」時代になったとして、最適なAIモデルやプロセスを選ぶことが重要だとして締めくくった。