dotDataは、独自の人工知能(AI)技術を利用してデータサイエンスプロセスを自動化することによって、従来、熟練した人材による広範囲な手作業を必要としていたデータサイエンスプロジェクトの生産性を劇的に向上させるソリューションを提供するという。
「dotData Enterpriseバージョン1.6」「dotDataPyバージョン1.2」の主な強化機能
・テキストデータの特徴量自動設計
新バージョンでは、テキストデータの特徴量自動設計をサポートし、コールセンターに蓄積される顧客企業からのフィードバック、営業報告書、会議議事録など、重要なしかし分析が難しいテキスト情報を扱えるようになった。
この機能は、従来の「静的」なテキストデータはもちろんのこと、テキストトランザクション、位置情報付テキスト、時間情報付テキストなど、テキストと他の情報を組み合わせることで特に真価を発揮し、従来は得られなかったビジネスの洞察を企業にもたらす。
・ディープラーニングのAutoML
新バージョンは、AutoML機能の一部として、TensorFlowやPyTorchなどの最先端のディープラーニングフレームワークをサポート。これにより、データサイエンティストも「市民」データサイエンティストも、高度なニューラルネットワーク手法を素早く試すことができるようになる。
さらに、「ブラックボックス」化しがちな高度な機械学習モデルの透明性を向上させるために、Permutation Importanceなどの特徴量検証方法が利用可能になった。
・より柔軟でセキュアなHadoopデプロイメント
dotData Enterpriseバージョン1.6では、企業がすでに導入済みのHadoop環境にdotDataをデプロイ可能となり、既存のITインフラストラクチャを活用してdotDataを導入することができる。
さらに、バージョン1.4でサポートされたKerberos保護に加えて、バージョン1.6は企業データを保護するための、より高度なHadoopセキュリティオプションをサポート。
・透明性向上のためのその他の機能強化
新バージョンでは、その他にも重要な機能強化が実装された。例えば、「進行状況の可視化」はタスクステータスを可視化し、より詳細な状況をユーザーが把握することができるようになる。
さらに、モデルインサイト機能として、様々な指標に関して機械学習モデルの比較分析が可能となり、ユーザーはモデルの挙動をより深く理解することができる。