このシステムは、AI技術とリアライズが持つシソーラスのナレッジを融合したもので、日本語の顧客リストのクリーニングおよびマッチング処理をAI技術の活用により自動化するもの。
このシステムによるサービス提供が実現することで、企業で部門ごとに管理されているデータや、正式名称と略称、入力ミスなど、これまで人間が目視で個々に判断し修正する必要のあった重複データの識別や統合処理を、自動かつ高速に行うことが可能となるとしている。
まず、基本サービスとなる「Data-Master01」について、10月19日からトライアルを開始し、さらなる検証を行い、2017年1月以降の本格提供を目指すという。
「今回、トライアルを開始する「Data-Master」は、企業の保有する法人顧客リストを預かり、重複データを精査し統合するなど、データを最適化するサービス。
入力ミスや部門ごとに管理されることで、同じ顧客企業でありながら別のコードで登録されたことによる重複、正式名称と略称の表記揺れに起因する重複、本社や支社・部署等により別データとされた重複等、さまざなデータの重複パターンをAI技術とシソーラスを用いて、データを識別・統合する。
「Data-Master」のシソーラスは、データが増えれば増えるほどデータが蓄積され、学習スピードと辞書の精度が高くなり、マッチ率がさらに向上していくという。