2030年、日本の人口の約3人に1人が65歳以上になる。熟練者の大量退職──同時に消えてしまうのは、その企業を根幹から支えてきた知識やノウハウだ。多くの企業が直面するこの問題に、ライオンはAIナレッジ検索システムにとどまらず、自社データを追加学習した独自LLM「LION LLM」の開発に踏み切った。本格運用前だが、既に見えてきたものは多いという。取り組みを主導するデジタル戦略部の百合祐樹さんに聞いた。
熟練者の“暗黙知”継承が課題に 歯の研究員に白羽の矢
「もともとは研究員で、歯の老化の研究をしていたんです」
ライオン デジタル戦略部で生成AIの導入・活用を推進する百合祐樹さん。80歳で自分の歯を20本残す「8020」では飽き足らず「8028」を目指し、どの成分が歯の老化を抑えるのか、データを使って追求するのが最初の仕事だった。化合物の効果をシミュレーションで予測し、新たな成分候補を探すうち、データサイエンスにのめり込んでいったという。そんな“ダイヤの原石”を、デジタル戦略部が見逃すはずがない。「デジタル戦略部の先輩が『一緒にやらないか』と声をかけてくれたんです。僕の恩人ですね」と百合さんは笑う。
研究員としての経験は、今の仕事に生きている。ドメイン知識はもちろん、データの質に関しては現場にいた人間だからこそピンとくることがあるからだ。たとえば特許調査では、同じ化合物でも文献によって「化合物名」「一般名」「略称」と様々な書かれ方をする。表記が揺れると調査の精度に影響が出るため、言葉の意味や関連性を整理する「シソーラス」と呼ばれるリストが必要になる。ところが実際には、そのデータが各研究員のPC上やベテランの脳内に分散していて、品質もバラバラ。AIエージェントの開発がスケールするにつれ、こうしたデータの整備が大きなボトルネックになることは目に見えているが、高度な専門性が求められる領域だけに、百合さんのバックグラウンドが大いに役立つ。
今の百合さんの研究テーマは、熟練者の退職とともに消えていく暗黙知を、いかに継承していくかである。粉末洗剤の製造プロセス開発は、その課題を象徴する領域だ。アジアでは粉末洗剤の需要が堅調な一方、国内は液体洗剤が主流であるため、粉末洗剤の製造ノウハウを体系的に学ぶ機会が得にくい。製造プロセスの開発には熟練者の暗黙知が不可欠だが、それを新たなメンバーに継承するには多くの時間と熟練者への負担が伴う。
そこに、生成AIの波が来た。2023年12月、百合さんらは生成AIと検索システムを組み合わせたナレッジ検索アプリ「LINK Chat(LION Innovation for Knowledge)」を内製開発し、研究開発部門に公開した。LINK Chatは、RAGを用いて過去の研究事例やドキュメントをチャット形式で呼び出せるアプリだ。試しに研究員の名前で検索すると、その人が関わった研究のデータやドキュメントがまとめて表示され、退職後も、その研究員の知識をたぐり寄せることができる。ただし、あくまでも「検索ツール」にとどまる。そのナレッジを使って研究をどう進めるかは、研究員自身が考えなければならない。
「どう検索するか」で二の足を踏む……自社LLM開発に乗り出す
その検索自体にも限界があった。LINK Chatは、人間が質問を投げかけると、AIが検索クエリを決めてデータベースを検索し、その結果をLLMに渡して回答を生成する仕組みだ。一見スムーズだが、使い込むほどに壁が見えてきた。
まず、研究者にとって専門外の領域では、そもそもどう検索するのが近道か分からない。するとAIも適切な検索クエリを生成できず、的を射ない回答になりがちだ。さらに、検索で得られた結果をすべてLLMに読み込ませようとしても、LLMが一度に処理できるテキスト量には上限がある。上限を超えた情報は切り捨てられ、不完全な情報をもとに回答が生成されてしまう。
データの問題もある。検索システムは上位の結果をAIに渡す設計のため、上位データの質がそのまま回答の質を決める。ノイズの多いデータが混じると精度が落ちる。かといって組織のドキュメントをすべてインデックスしようとすると数千万ファイルにのぼる。優先度の高いデータから選別し、整備していくしかない。
3つの壁の根本は、LLMが自社のドメイン知識を持っていないことだ。LLM自体があらかじめ自社のナレッジを学習していれば、検索クエリの精度も上がり、データ整備の負荷も減らせる。これが、百合さんがLION LLMの開発に踏み切った理由だ。
ただし、LION LLMを開発したからといって、LINK Chatがいらなくなるわけではない。LINK ChatのRAGが「登録済みの事実を検索する」のに対し、LION LLMは自社データを追加学習することで、RAGがカバーしきれない自社のナレッジや周辺情報まで網羅的に回答する。ただしその精度はトレーニングの質に依存するため、100%の精度は期待できない。「ファクトはRAGに担保させ、LLMはナレッジの網羅性を広げる役割を担わせる」と百合さんは説明する。
百合さんが目指すのは、「研究者が自身の研究に集中し、成果を上げやすい環境」だ。たとえば、研究員が課題を投げかけると、AIが研究計画書の叩き台を作り、実験の組み合わせを提案し、タスクにまで落とし込む。研究員はそこに自身の経験と知識を重ねて意思決定をする──そんなふうに研究員とAIが協働できれば、研究の効率は格段に上がるはずだ。
この記事は参考になりましたか?
- 酒井真弓の『会いたい人』連載記事一覧
-
- 消えゆく熟練の“暗黙知”に歯止め……ライオンが7B規模の「小型LLM」開発で知識継承の仕組...
- 経営層はやる気なのにDX人材はなぜ育たない?──四国電力260人を動かした、牽引者の“執念...
- 自治体DXの雄・都城市に聞く「やるだけ損」からのマインドチェンジ術──小さな変化のために挑...
- この記事の著者
-
酒井 真弓(サカイ マユミ)
ノンフィクションライター。アイティメディア(株)で情報システム部を経て、エンタープライズIT領域において年間60ほどのイベントを企画。2018年、フリーに転向。現在は記者、広報、イベント企画、マネージャーとして、行政から民間まで幅広く記事執筆、企画運営に奔走している。日本初となるGoogle C...
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア
