「データ主権」と「精度」を両立する──大和総研、京都大学、みずほFG、KDDIの金融AI実践報告
NVIDIA 金融AI Meet-up with Macnica(後編)
2026年4月17日に東京・丸の内で開催された「NVIDIA 金融AI Meet-up with Macnica」。前編ではNVIDIAの基調講演、楽天グループ、ファーストアカウンティング、野村総合研究所、リコーの5セッションを取り上げた。後編では、大和総研のNVIDIA NIM本番運用検証、京都大学・南 正太郎准教授の情報品質を数学的に保証するアプローチ、そしてみずほフィナンシャルグループとKDDIが取り組む独自LLM開発とセキュアなAI基盤の構築を紹介する。
前編ではNVIDIAの基調講演、楽天グループ、ファーストアカウンティング、野村総合研究所、リコーの記事はこちら。
大和総研:NIMの本番耐久性、vLLM比で処理時間を半減
大和総研で基盤技術第一部副部長を務める及川涼太氏は、オンプレミスのGPUサーバー(NVIDIA H100×2枚)にNVIDIA NIMを導入した4ヵ月間の実機検証(2025年9〜12月)の結果を報告した。大和証券・大和総研・伊藤忠テクノソリューションズ(CTC)・NVIDIAの4社体制で進めたプロジェクトだ。
ユースケースとして想定したのは「音声データからの文字起こしと文章要約」だ。現在、大和証券では営業員と顧客のやりとりをAzure上のモデルで文字起こし・要約してコンタクト管理システムへ登録する仕組みが稼働しているが、このクラウド部分をローカルモデルで代替できないかを検証した。評価軸は「精度」「性能(スループット)」「費用」の3つで、本日の報告ではNIMの効果が特に顕著だった「性能」を中心に発表した。
NIMとvLLMを比較した性能評価の結果は明確だった。並列度を上げるほどNIMの優位性が際立ち、大規模並列実行ではvLLMと比べて処理時間が約半分まで短縮された。GPU使用率もほぼ100%を維持しており、リソースを極めて効率的に活用できていることが確認された。加えて24時間連続稼働試験においてもエラーやメモリリークは発生せず、本番運用に耐えうる安定性が示された。
「NIMは単なるお試し用の技術ではなく、実際の運用を前提に選べるソリューションだ」と及川氏は評価した。今年夏を目標に、文字起こしにNVIDIAの「Parakeet(パラキート)」、文章要約に「Nemotron(ネモトロン)」を組み合わせた本番運用への切り替えを進める方針で、並行してNeMo Guardrailsによるセキュリティ機能の検証も実施しているとした。
京都大学 南准教授:情報品質を数学で保証する「アーマードLLM」
京都大学経営管理大学院特定准教授の南正太郎氏の発表は、かなり理論的な内容だった。テーマは「金融を変える情報品質保証」──生成AIが抱える構造的問題への根本的なアプローチだ。
「金融機関はブルームバーグや証券レポートに多額を払っているが、最もお金をかけている情報が実は最も効率よく使えていないのではないか」と南氏は問いかけた。
現在の生成AIには、同じテキストについて有価証券報告書なのかニュース記事なのかといった「情報の質」を区別して処理する仕組みがない。情報の重み付けが同一のため、1次情報と不確かな情報が等価に扱われてしまう。
「ビッグテックも“データの品質が大事”とは分かっているが、全員が経験則でしか対応できていない。数学的な根拠を持った品質保証は誰もできていない」と述べた。
この問題に対して南氏が提唱するのが「TAP(Tomography Asset Pricing)理論」だ。情報の「誰が」「いつ」得たのかによって品質をスコアリング・フィルタリングする理論的枠組みであり、AIの外側にこのフィルターを置いた「アーマードLLM(Armored LLM:装甲をまとったLLM)」として実装できる。フィルターを外付けするためLLM自体を改造する必要がなく、どんなLLMにも適用できる点が特徴だ。
スライドでは、NVIDIAのオープンソースモデルを活用したWikipedia日本語データへのTAPフィルタリング結果が示された。Finance(金融)ドメインは88.3%、Legal(法務)ドメインは85%の採用率で高品質と判定された一方、一般情報は採用率0%に自動的に絞り込まれた。
「Finance/Legalに絞る設定をしたのではなく、各ドメインの情報伝達特性に基づいてσ²(ノイズ指標)を設定した結果だ」と南氏は説明した。有価証券報告書や判例・条文など厳密に規格化された一次情報が多い金融・法務は採用率が高く、主観や曖昧さが入りやすい一般情報は自動的に弾かれるという。
このTAPフィルタリングを通じた追加学習では、通常起きる「カタストロフィック・フォアゲッティング(既知知識の忘却)」がほぼ発生せず、特定分野の知識を追加しながら既存の性能を維持できた。さらにNemotron-Hybridアーキテクチャを活用してTAPP情報をモデル内部に組み込んだ120Mという極小モデルを構築し、カリフォルニア工科大学チームの1ビット量子化モデルにTAPP情報を加えることで通常の大型モデルを超える性能を実証したとも述べた。
南氏が京都大学で稼働させているシステムは4種類。アクティビスト・アクティブ・パッシブ・アナリストの4投資家エージェントが企業を多角評価する「IR対話エージェント」(Nemotron-9B LoRA JPを活用、有価証券報告書47,178件・24,492社のDBを参照)、L/Sポートフォリオ最適化システム、参加者のプロフィールを考慮してエージェント同士が議論する役員会合意支援システム、株主総会のリアルタイム対応支援システムだ。
「情報の質を管理すれば、小さなモデルでも大きな性能を発揮できる。NVIDIAとともにこれを本物のシステムとして構築したい」と述べ、将来的にはAI専用OSの必要性にまで言及した。
この記事は参考になりましたか?
- 財務・会計Online Press連載記事一覧
-
- 「データ主権」と「精度」を両立する──大和総研、京都大学、みずほFG、KDDIの金融AI実...
- 金融AIは「使う」から「所有して育てる」へ──NVIDIA、楽天G、NRI、リコーらが実践...
- 新リース会計基準まもなく「強制適用」……この“好機”を単なるシステム刷新で終わらせてよいの...
この記事は参考になりましたか?
この記事をシェア
