「データ主権」と「精度」を両立する──大和総研、京都大学、みずほFG、KDDIの金融AI実践報告
NVIDIA 金融AI Meet-up with Macnica(後編)
みずほFG:2週間スプリントで実務テスト正答率90%弱に到達
みずほフィナンシャルグループのデジタル戦略部テクノロジー第二チームでヴァイスプレジデントを務める皆川拓氏は、2025年4月から本格化した「みずほLLM」の開発プロセスを公開した。
金融機関が独自LLMを構築する理由として、皆川氏は3つを挙げた。顧客情報や審査ノウハウなど地政学的リスクを考慮しても外部には送れないデータの機密性、金融商品取引法・銀行法といった法令順守をモデルレベルで担保する必要性、そして行内特有の書式・略称・複雑な業務フローを汎用モデルが正確に扱い切れない専門業務対応だ。「金融インフラを担う私たちにとって、独自のLLMを用いて自社環境で完結できる基盤を持っておくことは極めて重要だ」と皆川氏は語った。
開発は3段階のロードマップで進む。金融規制法令や公開金融資料を学習した「金融特化LLM」を土台に、与信判断、稟議書作成、商品提案といった業務別の「特定領域特化LLM」を複数生成し、最終的に複数の特化モデルが連携する「協調型」へと発展させる構想だ。
評価設計に特に力を注いだ点が印象的だ。銀行員向けの実務テスト(外国為替、個人営業基礎、渉外基礎、融資、預金為替など)を正答率のベンチマークに設定し、「人間と同等以上で、安全に判定・回答できる水準」を目標に掲げた。ベースモデルで70%台前半だった正答率は、社内データの整備と追加学習の繰り返しにより90%弱まで向上。特定の金融タスクではGPT-5.4相当のスコアも出るようになったという。
開発は2週間スプリントのアジャイルサイクルで回しており、実験管理にはWeights & Biasesを使って全パラメータと結果を一元管理する。学習率やLoRAのパラメータ設定を論文・技術記事を参照しながら丁寧に最適化し、手戻りを減らして再現性の高い開発を実現しているとした。NeMo CuratorとNeMo Data Designerを活用した合成データ生成・クリーニングも現在進行形で実施しており、次の焦点は「答えだけでなく推論プロセスを含む合成データ」での学習だと皆川氏は述べた。熟練営業職員の思考プロセスをAIに学習させることが、銀行実務での実効性を高める上で重要になると見ている。
この記事は参考になりましたか?
- 財務・会計Online Press連載記事一覧
-
- 「データ主権」と「精度」を両立する──大和総研、京都大学、みずほFG、KDDIの金融AI実...
- 金融AIは「使う」から「所有して育てる」へ──NVIDIA、楽天G、NRI、リコーらが実践...
- 新リース会計基準まもなく「強制適用」……この“好機”を単なるシステム刷新で終わらせてよいの...
この記事は参考になりましたか?
この記事をシェア
