SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

最新イベントはこちら!

Enterprise IT Women's Forum

2025年1月31日(金)17:00~20:30 ホテル雅叙園東京にて開催

Security Online Day 2025 春の陣(開催予定)

2025年3月18日(火)オンライン開催

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

EnterpriseZine(エンタープライズジン)

EnterpriseZine編集部が最旬ITトピックの深層に迫る。ここでしか読めない、エンタープライズITの最新トピックをお届けします。

『EnterpriseZine Press』

2024年秋号(EnterpriseZine Press 2024 Autumn)特集「生成AI時代に考える“真のDX人材育成”──『スキル策定』『実践』2つの観点で紐解く」

EnterpriseZine Press

生成AI活用を阻む3つの課題 汎用型LLMと共存する「自社特化型LLM」構築のポイントとは

ハルシネーション、セキュリティ、コストの課題を解決する“段階的な”LLM開発術

ゼロからLLMを構築する際の注意点は?

STEP.3 自社専用LLMをゼロから構築する

 最後のステップは、自社専用のLLMをゼロから構築する手法だ。追加学習では、どうしても汎用型LLMが元々学習しているデータとの相性が悪く、自社業務や狙ったユースケースで求められる精度が達成できない場合がある。そのような場合は、ゼロからモデルをトレーニングして解決を目指すことになる。

 たとえば、Bloombergでは、金融分野の難解な文書を扱えるモデルの構築のために、ゼロから専用のLLMの学習を実施。同社がフォーカスした金融ドメインで、高い精度を達成できるLLMの開発に成功している[5]

 また、ストックマークが提供するビジネス情報検索サービス「Anews」では、ChatGPTなどが得意ではない最新の時事話題や、専門的な技術情報の検索を行うユーザニーズが高かったため、当該ユースケースに焦点を絞った学習データを用意。1000億パラメータのLLMを、ゼロから学習・構築した。

 その結果、当該モデルは、時事話題や技術情報の質問回答に絞ったベンチマークであるStockmark Business Questions[6]において、GPT-4の64%の精度を上回る、90%で正答できる精度水準を実現している。

[クリックすると拡大します](提供:ストックマーク株式会社)
[クリックすると拡大します](提供:ストックマーク株式会社)

 なお、これらのモデルは自社開発となるため、ライセンスの制約を受けていない。また、自社内にこのLLMをホスティングすることもできるため、セキュリティ性も担保した自社専用LLMの構築が可能となる。

 さらに、ゼロから自社専用LLMを開発する手法を採用すれば、コスト効率性の高い軽量なLLMの開発も可能である。

 Preferred Networks(PFN)では、大型LLMから自社のユースケースに沿った学習データを自動生成。当該データを小型LLMの学習に用いることで、エッジデバイスでも利用可能な10億パラメータ規模の、小型ながら高性能なモデルの開発に成功している[7]

 ただし、ChatGPTやLlamaなどから生成されたデータを用いて商用のLLMを作成することは、ライセンス的に禁止されている。そのため、NVIDIAなどが公開している大型LLM[8]から学習データを自動生成し、自社のコスト要求に沿った小型LLMを構築する必要がある点には注意したい。

日本のエンタープライズ企業で、特化型LLMの構築がもつ意義とは

 ChatGPTの汎用性は非常に高い。一方、すべてのユースケースをChatGPTなどの汎用LLMだけでカバーすることは、難しい場合がある。特に、企業利用のように信頼性やコスト効率性・軽量性の観点が特に強く求められるユースケースではその傾向が顕著だ。そのため、今後も自社専用や特化型のLLMの構築技術は、並行して開発されていくことが予想される。

 特に日本は、世界有数の歴史ある経済大国として、各企業の中に膨大で機密性の高いデータが蓄積されている。ChatGPTの学習量は1ペタバイトに満たないが、エンタープライズ企業1社で100ペタバイトにものぼる場合もあると言われている[9]

 これらのデータを有効活用し競争力のある独自の生成AIを開発するためにも、高い信頼性のもとで運用できる特化型LLMの構築技術の確立が、引き続き検証され続けていくと考えられる。

 すでに先進企業では、こうした取り組みが始まっている。たとえば、パナソニック ホールディングスとストックマークは、パナソニックグループ専用のLLM「Panasonic-LLM-100b」の開発に向けた協業を発表している[10]

 このプロジェクトでは、ストックマークが独自に開発した「Stockmark-LLM-100b」[11]に、パナソニックグループの社内データを追加事前学習させる形で「Panasonic-LLM-100b」を構築。モデルサイズは1000億パラメータを予定しており、企業が開発する自社専用LLMとして、国内最大規模となる見込みだ。

 また、当モデルは、独自に収集したビジネスドメインの日本語データを中心に事前学習を行うことで、日本語・ビジネス領域に特化し、ハルシネーションの抑止を実現。厳密さが重視されるビジネスシーンでも、信頼して利用できるようになる。この取り組みは、特化型LLMの可能性と、日本企業の強みを象徴する事例として注目されている。

【前編はコチラ】

この記事は参考になりましたか?

  • Facebook
  • X
  • Pocket
  • note
EnterpriseZine Press連載記事一覧

もっと読む

この記事の著者

有馬 幸介(アリマ コウスケ)

ストックマーク株式会社取締役CTO。2008年東京大学工学部計数工学科卒業。10年東京大学大学院情報理工学系研究科修士課程修了。同年新日鉄住金ソリューションズ(現 日鉄ソリューションズ)入社。16年ストックマーク社を共同創業し、取締役CTOとして機械学習、インフラ〜アプリケーション全般を担当。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/20906 2024/12/17 08:00

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング