富士通は2025年9月8日、AIサービス「Fujitsu Kozuchi」のコア技術として、大規模言語モデル(LLM)の軽量化・省電力を実現するAI軽量化技術である生成AI再構成技術を開発、同社のLLM「Takane」を強化することに成功したと発表した。
同技術は、AIの思考の基となる各ニューロン間の結合に割り当てられる重みを極限まで圧縮する世界最高精度の量子化技術と、軽量化と元のAIモデルを超える精度を両立させた世界初(同社調べ)の特化型AI蒸留技術の2つのコア技術から成るという。同技術のうち量子化技術をTakaneに適用することで、1ビット量子化(メモリ消費量最大94%削減)で、量子化前と比較して世界最高の精度維持率である89%と、量子化前の3倍の高速化を実現したとのことだ。
なお、この精度維持率は量子化における従来の主流手法(GPTQ)の精度維持率(20%)を大きく上回るものだとしている。これにより、ハイエンドのGPU4枚を必要とする大型の生成AIモデルを、ローエンドのGPU1枚で高速に実行することが可能になったという。
同技術による軽量化は、スマートフォンや工場の機械といったエッジデバイス上でのAIエージェントの実行を可能にするとのことだ。これにより、リアルタイム応答性の向上とデータセキュリティの強化、AI運用における抜本的な省電力化を実現するという。同社は、量子化技術を適用したTakaneのトライアル環境を2025年度下期より順次提供開始。加えて、Cohere社の研究用オープンウェイト「Command A」を同技術により量子化したモデルを、Hugging Face経由で9月8日より順次公開するとのことだ。
生成AI再構成技術を構成する2つのコア技術の詳細は以下のとおり。
1. AIの思考を効率化し、消費電力を削減する量子化技術
生成AIの思考の基となる膨大なパラメータの情報を圧縮し、生成AIモデルの軽量化・省電力化と高速化を実現。従来手法では、LLMのような層が多いニューラルネットワークにおいて、量子化誤差が指数関数的に蓄積することが課題だったという。そこで、同社は理論的洞察に基づき、層をまたいで量子化誤差を伝播させることで増大を防ぐ新たな量子化アルゴリズム(QEP:Quantization Error Propagation)を開発した。加えて、同社が開発した大規模問題向けの世界最高精度の最適化アルゴリズムであるQQAを活用することで、LLMの1ビット量子化を実現したとのことだ。

2. 専門知識を凝縮し、精度を向上させる特化型AI蒸留技術
脳が必要な知識を強化し、不要な記憶を整理するように、AIモデルの構造を最適化する。まず基盤となるAIモデルに対し、不要な知識を削ぎ落とすPruning(枝刈り)や、新たな能力を付与するTransformerブロックの追加などを行い、多様な構造を持つモデル候補群を生成。次に、これらの候補の中から同社独自のProxy(代理評価)技術を用いたNeural Architecture Search(NAS)により、顧客の要望(GPUリソース、速度)と精度のバランスが取れた最適なモデルを自動で選定するという。最後に、選定された構造を持つモデルに、Takaneなどの教師モデルから知識を蒸留。このアプローチにより、特化したタスクで基盤の生成AIモデルを上回る精度を達成するとしている。
また、同社のCRM(顧客関係管理)データを用いて各商談の勝敗を予測するテキストQAタスクの実証では、同技術により過去データに基づくタスクに特化した知識のみを蒸留したモデルを用いることで、推論速度を11倍に高速化しつつ、精度を43%改善。高精度化とモデル圧縮を同時に実現することで、教師モデルを超える精度をより軽量な100分の1のパラメータサイズの生徒モデルで達成できると確認したという。そして、必要なGPUメモリと運用コストをそれぞれ70%削減すると同時に、より信頼性の高い商談勝敗予測が可能となった。また、画像認識タスクにおいては、未学習の物体に対する検出精度を、既存の蒸留技術と比較して10%向上させることに成功。これは、同分野における過去2年間の精度向上幅の3倍以上に相当する成果だという。

今後は、金融、製造、医療、小売など、より専門性の高い業務に特化したTakaneから生まれる軽量AIエージェント群を開発・提供していくとのことだ。また、同技術を発展させ、生成AIの精度を維持したままモデルのメモリ消費量を最大1,000分の1へ削減すると同社は述べる。将来的には、これらの特化型Takaneを進化させて、複雑な課題に対して自律的に最適な解決策を導き出すAIエージェント向けの生成AIアーキテクチャに発展させていくとしている。
【関連記事】
・富士通・Arrcusら3社、AIインフラ強化・ネットワーク製品提供に向け協業 2030年までに約300億円の売上目指す
・富士通、ヘルスケア特化型AIエージェント活用基盤をNVIDIAと構築 2025年内の収益化目指す
・富士通、生成AIを業務に組み込むプラットフォーム提供へ '29年度末までに約150億円の売上目指す
この記事は参考になりましたか?
- 関連リンク
- この記事の著者
-
EnterpriseZine編集部(エンタープライズジン ヘンシュウブ)
「EnterpriseZine」(エンタープライズジン)は、翔泳社が運営する企業のIT活用とビジネス成長を支援するITリーダー向け専門メディアです。データテクノロジー/情報セキュリティの最新動向を中心に、企業ITに関する多様な情報をお届けしています。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア