AI insideは、日本語のドキュメント処理に特化した独自開発のLLM(大規模言語モデル)「PolySphere-2」を「PolySphere-3」へとメジャーアップデートした。データ構造化の精度において、世界最高性能を達成したと同社は述べている。
同アップデートは、経済産業省と新エネルギー・産業技術総合開発機構が実施する、日本国内における生成AIの開発力強化を目的としたプロジェクトGENIAC(Generative AI Accelerator Challenge)に採択された研究テーマ「生成AI基盤による非定型帳票の革新と自律促進」の成果に基づいているとのことだ。
GENIAC事業における研究成果
AI inside は GENIAC第2サイクルにて「PolySphere-3」の開発を通じて、データ構造化の精度において世界最高性能とするLLM「PolySphere-3」と、軽量で処理速度が速い「PolySphere-3 Lite」の2つのモデルを構築したという。
- 95%以上の読取精度:PolySphere-3では、50種類の帳票に対して平均95.1%の読取精度を記録
- モデルの軽量化による処理速度の向上:モデルを軽量化したPolySphere-3 Liteは、従来のPolySphere-2と同等の読取精度を維持しながら、処理速度の向上を実現しているとのこと
- 継続的な精度向上を実現するテクノロジー:モデルが自ら帳票を学習・最適化し、継続的な精度向上を実現する「自律蒸留」の仕組みを構築

「DX Suite」への社会実装
AI insideは、データ入力業務を自動化するAIエージェント「DX Suite」の項目抽出機能にPolySphere-3を実装し、非定型帳票における読取精度の向上を図ったという。ユーザーは追加の手続きや費用なしで項目抽出機能を利用できるとのことだ。
- 最適なモデル選択:デフォルトでは精度重視のPolySphere-3が適用されており、処理速度を重視するユーザー向けには、軽量モデルのPolySphere-3 Liteへの切り替えも可能
- 継続的な学習と精度向上:DX Suiteでは、月平均2億回を超えるOCR処理が行われており、研究成果として得られた自律蒸留の仕組みによって、今後も継続的な精度向上が期待できるとのこと
【関連記事】
・AI inside、「DX Suite」にAIエージェントを搭載 すべてのユーザーに正式提供へ
・AI inside「DX Suite」にAIエージェント搭載 “AIを評価する”AIでデータ入力自動化へ
・AI inside、DX Suiteに新機能「Few-shot学習」を実装
この記事は参考になりましたか?
- 関連リンク
- この記事の著者
-
EnterpriseZine編集部(エンタープライズジン ヘンシュウブ)
「EnterpriseZine」(エンタープライズジン)は、翔泳社が運営する企業のIT活用とビジネス成長を支援するITリーダー向け専門メディアです。データテクノロジー/情報セキュリティの最新動向を中心に、企業ITに関する多様な情報をお届けしています。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア