NTTデータは、7月10日、金融版BERTを用いた自然言語処理技術について、7月以降に実証検証を順次開始すると発表した。同検証は、銀行や証券会社などの金融関連企業を募って実施される。
金融版BERTは、自然言語処理において近年注目を集めているBERT(Bidirectional Encoder Representations from Transformers)を、金融業界向けにNTTデータが独自に特化させた言語モデル。金融専門用語や特有の文脈を含む文書を解析する際に、その都度言語モデルの学習を行う必要がなくなり、学習工程を短縮しつつ、高精度の結果を得ることが可能になる。
NTTメディアインテリジェンス研究所では、日本語Wikipediaに加えてニュースサイトやブログから収集した、12.7GBの大規模コーパスで学習させたBERTモデル(NTT版BERT)を開発した。今回の金融版BERTは、このNTT版BERTにNTTデータで独自に収集した金融関連文書を用いて、金融文書向けに追加学習を行っている。
金融版BERTについては、日報からの情報抽出、稟議書の記載内容チェック、財務情報からのリスク抽出、FAQの回答自動引き当て、チャットボットによる問い合わせ対応などの業務における活用を想定。NTTデータでは2020年度中に、5件の金融版BERTに関する実証検証を予定する。また、実証検証の成果を活かして、2021年度中に金融版BERTサービスの提供開始を目指す。
NTTデータは、同社の自然言語処理に関する独自ノウハウや技術を活用して金融版BERTの実モデル適用を進めるべく、検証賛同企業として金融機関の申し込みを9月末まで受け付ける。受け付け後には、金融機関とNTTデータで検証計画を擦り合わせ、NTTデータにおいて効果測定、分析を行う。検証を通じて、技術の有効性やビジネスへの導入に向けた課題、対応方法を明らかにしていく。