自社専用LLMは必要か? 活用を阻む3つの課題
ChatGPTは2022年11月の公開以来、2024年8月時点で週間アクティブユーザーが2億人を突破し[1]、大きなイノベーションを生み出している。一方で、特に企業での生成AI活用に焦点を絞ると、実際の利用頻度は定常利用(1日2回以上)が21%、定期利用(1日1回)が14%、不定期利用(数日に1回程度)が35%、未利用(それ以下、または使っていない)が30%と、いまだ実態として定常利用には至っていない[2]。
企業活用を阻む大きな要因としては、以下のような課題が挙げられる。
1. ハルシネーションの抑止
多くの企業が抱えるデータには、自社の専門用語などを用いて記述された、難解な文書が多数存在する。汎用型のLLMでは読解が難しく、結果としてハルシネーション(人工知能が学習したデータからは正当化できないはずの回答を堂々とする現象)が多発してしまうケースがある[3]。
2. セキュリティの懸念
企業内の文書は、秘匿性が極めて高いケースがある。たとえば、日本の製造業が保有している社内文書には、国防に関わるような機密データが含まれる場合があるため、ChatGPTなどといったブラックボックス性の高いAPI型のLLMを使えないことがある。
3. コスト効率の課題
信頼性という点に加えて、コスト効率性という観点からLLMを業務で用いていないケースもある。LLMのモデルサイズは大型化しており、ChatGPTのモデルサイズは1000億パラメータ以上あると推定される。
1000億パラメータのLLMを運用する場合、購入すると数千万円はするH100 GPU 8基などの高火力計算サーバーを用意する必要がある。結果として、コストがメリットに見合わずに導入見送りとなるケースも存在する。
これらの汎用型LLMの課題を解決する手段として、自社専用の特化型LLMを構築し対応するという方法がある。ただし、開発工数がいたずらに大きくなるケースも有り得るため、いくつかのステップに分けて自社専用LLMの構築を段階的に行うことが必要だ。
[1]「OpenAI says ChatGPT usage has doubled since last year」(AXIOS, 2024年8月29日)
[2]「<ビジネスシーンにおける生成AIの実態調査> 企業における生成AIの「日常的な利用」は約4割未満 幅広い用途の中でも「社内情報を活用」できると利用者は7割まで上昇」(ストックマーク, 2024年4月18日)
[3]「生成AI使用企業は35%、情報漏洩やハルシネーションなど懸念か──ITR・JIPDEC調査」(EnterpriseZine, 2024年3月15日)