アナリティクス・ライフサイクルの全プロセスをトータルに支援
さらに統合グラフィカル・ユーザー・インターフェースを用いて、アナリティクス・ライフサイクルの各フェーズにおける「SAS Viya」の具体的な活用が紹介された。アナリティクス・ライフサイクルは、「Data」「Discovery」「Deployment」という3つのプロセスで構成されている。
まず事前のデータ準備を行なう「Data」では、通常2つの方法が考えられる。情報システム部門が用意するDWHやデータマートを活用する方法と、セルフサービス型で実行する方法だ。しかし、前者では必ずしも望むようなデータになっているとは限らない。そこで、分析要件ごとに異なるデータが必要になるたびに、自ら簡単に準備できる環境が必要というわけだ。「SAS Viya」では、データのプロファイリングからクレンジング、加工・変換・結合といった一連の作業を、分析者自身がGUIベースで行なえる。
次に「Discovery」の最初のタスクは、準備したデータの探索・分析だ。ここでもマウス操作で過去のデータや高度な機械学習を用いることができ、結果が自動的にビジュアライズされる。それをダッシュボードとして共有することも可能だ。また簡単な操作で、ビジュアル・パイプラインを用いて、機械学習・時系列予測・テキスト解析モデルを生成できる。テンプレートも用意されているので、容易に高精度な予測モデルを自動生成することが可能だ。なお、金融業の与信のように予測モデルをホワイトボックス化することが求められるケースもある。そこで業務要件に応じたモデリングのブラックボックス化、ホワイトボックス化が選べる仕様になっているという。
ここで通常ブラックボックス化しがちな機械学習やディープラーニングの判断根拠を可視化する手法などが紹介された。機械学習のモデル内容の説明や結果の解釈のために3つの手法(PD, ICE, LIME)が用意されている。また、ディープラーニング(CNN)による画像認識の判断根拠に関しても、カラフルなヒートマップを出力し、入力画像のどこに着目して判断を下したのかを容易に確認することもできる。説明責任が求めれらるような業務要件において、これらの機能は強力な武器となるだろう。
そして最後の「Deployment」では、作成したモデルを統合的に管理した上で、スピーディにビジネスプロセスに実装できる点が強みとなる。これからの時代、データはもとより予測モデルは企業の重要な資産となるのは明白だ。『SAS Viya』では、モデルのバージョン管理や業務プロセスへの実装、そして実装後の精度のモニタリングなどを容易に実現可能となる。
さらに通常であれば本番環境で、モデルにあてはめるデータをデータベースなどから取得して来る必要があるが、それが膨大だった場合、取得やデータ転送に時間がかかりすぎる可能性がある。そこで、データのある場所(データベース)や、IoTなどデータが発生するところにモデルを配置し、その中でスコアリングを実行可能だ。
畝見氏はこれらについてデモンステーションを行なってみせた。そして、改めてアナリティクスのスキルやナレッジ、環境がサイロ化していることの問題とその解決策としてのオープン・AIプラットフォーム『SAS Viya』の有用性を強調し、セッションを終えた。