日立製作所(以下、日立)は、「ダークデータ」と呼ばれる、日々の企業活動で生成・蓄積されるものの有効活用できていない膨大なデータに、新たな価値を見いだす「データ抽出ソリューション」を開発。6月23日より販売を開始することを発表した。
本ソリューションは、日立が参画する米国スタンフォード大学の企業参画プログラムで開発されたAIを中核としたダークデータ分析エンジンを活用。請求書や診療明細書といった発行元によって様式や表記が異なる非定型ドキュメントの利活用において、取得したいデータの抽出作業を自動化・高度化するものだという。
人が文書を読む際に、テキストだけでなく、全体のレイアウトや単語の出現位置など視覚的な情報から文書を捉えるように、AIが、表や図、テキストの座標といったドキュメント内の様々な特徴から文書の構造全体を解析し、非定型の多種多様なドキュメントのデータ抽出に対応。また、少ない教師データからAIモデルを生成できる自動ラベリング機能により、導入時のモデル構築や、追加学習・再学習といったモデルの改修にも柔軟に対応できるとしている。
なお、本ソリューションは、同社の専門エンジニアが業務で扱うドキュメントに適したモデルの構築を行うなど、業務内容に応じた最適な導入・運用のコンサルティングを行うという。
今後、日立は、画像や映像、音声といった、企業が保有するダークデータ全般に対応するソリューションの実現に向け、AIの抽出機能をさらに強化し、Lumadaソリューションの一つとして、社会や企業におけるデータ利活用による新たな価値の創出や課題解決を支援するとしている。
【関連記事】
・日立グループ、総務省「自治体DX推進計画」に対するソリューションを新たに体系化
・日立、「個人情報管理基盤サービス」提供でパーソナルデータの利活用を支援
・日立、Lumadaなどが評価され「DXグランプリ2021」に選定