データ準備、探索、そしてモデル生成作業を自動化するSAS Viyaの拡張アナリティクス
SASはAIプラットフォーム「SAS Viya」で拡張アナリティクスを備えている。セッションで畝見氏は、分析業務プロセスの発見(ディスカバリー)フェーズをカバーするデータ準備作業の効率化・自動化の拡張アナリティクスとなる「Smart Data Transformations」、データ探索作業の効率化・自動化「Automated Visual Exploration」、モデル生成の自動化「Automated Machine Learning」、そしてモデル解釈情報を提供する「Built-In Interpretability」の4つをデモした。
発見フェーズの最初のステップとなるデータ準備は、データの収集、クレンジング、加工変換、モデル開発むけ学習用データ前処理などの作業が含まれる。データサイエンティストは実に、70%の時間をこの準備作業に費やしていると言われており、効率化が大きな課題となっていた。
SAS Viyaの拡張アナリティクス「Smart Data Transformations」は、この問題の解決を図るものだ。デモではローン審査業務で顧客ごとの債権不履行有無のデータに対してSmart Data Transformationsを用いることで、データソースを選択すると中身が画面に表示され、AIがデータの中身を自動でプロファイリングして探索し、その結果をビジュアルに表示したり、1クリックで登録済みのデータ準備に基づく分析を実行してデータ加工変換の推奨内容を提示するなどを見せた。
データ探索の拡張アナリティクス「Automated Visual Exploration」は単一画面でデータの探索、データマイニング、機械学習、評価を利用できるものだ。通常であれば試行錯誤を繰り返す作業を効率化できるという。データリスト画面内で変数を選択すると相関の強い変数を提示するなどのことも可能だ。
「異なる数値変数間の相関を捉えたい場合、これまでは散布図を描いたり、相関係数を計算して、その結果を表などで出力する必要があったが、そうした作業なしに変数間の相関を把握できる」と畝見氏は違いを説明する。
また、変数が増えるとどの変数をどのようなチャートで探索するのが最適なのかなど組み合わせは多数考えられるが、すべてを試すことはできない。現在は過去の経験に基づいて決め打ちで行っているが、Automated Visual Explorationでは変数、あるいは変数と変数の組み合わせに応じて最適なチャートやビューを提示してくれるという。
Automated Visual Explorationではまた、「AIストーリーテラー」という機能も紹介した。AIがデータの中身を解析し、機械学習モデルを構築し、そのモデルから得られた洞察を文章にするというものだ。
デモではターゲットマーケティングとして、予測モデルに基づく保険商品販売キャンペーンに反応する顧客を分析し、「1万9,000名中6,700名、34.64%の顧客が反応している」といった説明が表示され、合わせて反応フラグに影響及ぼす要因として「普通預金口座収支」「当座預金口座残高」といった変数の重要度をカラフルに表示したり、反応フラグと変数に該当するグループの関係の詳細もグラフィカルに示した。
また、最も反応している率が高いトップグループの条件に該当しながらも、いまだに反応していない顧客にアプローチするとどうなるのか、といった次のアクションにも簡単につなげることができるという。
モデル生成では、Automated Machine Learningを利用してわずか3ステップで精度の高いモデルを生成するためのパイプラインを自動生成して見せた。自動生成されたパイプラインはカスタマイズも可能という。モデル生成ではまた、解釈情報を自動取得できる拡張アナリティクスBuilt-In Interoperabilityも紹介した。