dotData社は、企業におけるend-to-endでのデータサイエンスの自動化とともに分析プロセスの運用自動化を可能にするソフトウェア製品やサービスの開発を行っている。その製品である「dotData」は、企業内に蓄積されるビッグデータを活用した課題解決を加速するために、データ分析プロセスをAIによって自動化するソフトウェアになる。
データ分析ニーズの高まりと、データサイエンティストの不足という社会課題に対して、「dotData」をにより応えていくという。日本国内では、NECがdotData社から本ソフトウェアの独占販売権を取得し、2018年7月から提供している。
「dotData」機能強化のポイント
1. 属性に基づく特徴量設計の強化
「dotData」による特徴量設計は、各顧客の購買履歴や顧客属性などからデータ分析に効く特徴量を自動で作り出すことが可能。しかし、新規顧客に対しては十分な購買履歴が得られない場合もある。
今回の機能強化により、属性が類似する顧客に対して共通する特徴量を自動設計できるようになった。これにより、購買履歴が不十分な新規顧客の需要を予測するといった高度なユースケースにも適用の幅を広げることが可能となる。
2. dotData Retraining APIの提供とModel Portingによる運用機能の高度化
・dotData Retraining API:特徴量の再設計と機械学習モデルの再学習をAPIから実現できる。これにより、特徴量とモデルの定期的な自動メンテナンスが可能となり、運用の自動化を実現。
・Model Porting:モデルを実運用する際には、モデルの開発環境と本番環境が異なる場合がある。Model Portingは、わずか数クリックで開発環境から本番環境にモデルを移行することができ、より現実的かつ効率的なdotDataの開発運用が可能になる。
3. 特徴量とモデルからインサイトを得るための可視化機能の強化
今回の機能強化では、特徴量が自然言語により説明され、「dotData」が特徴量を作り出す過程が可視化される。また、各特徴量の統計量や分布も可視化されるため、視覚的により深い知見(インサイト)をデータから得ることができ、分析結果に基づく経営判断を容易にする。
また、「dotData」により作り出される数百ものモデルについて、その精度と学習時・予測時での当てはまりの違いが統計量として可視化されることで、モデルを理解するデータサイエンティストの業務も効率化される。