BI分野のホットトピック:拡張アナリティクス
AIが様々な業務や分野に浸透しているが、分析やBIも例外ではない。AIや機械学習が組み込まれた分析、これによって分析を自動化するのが拡張アナリティクスだ。調査会社のガートナー ジャパンは2019年のデータ/アナリティクステクノロジートレンドのトップ1として拡張アナリティクスを挙げている(参照)。
畝見氏は拡張アナリティクスを、「データ活用を民主化する技術」と位置付ける。これまでデータ活用分野は、レポート作成、詳細情報を得るためのドリルダウン、アラートなどBIツールのセルフサービス化と民主化が進んできた。しかし得られる成果は「過去の見える化」に止まっていた。
「厳しい経済情勢を生き残るために、AIやアナリティクスを活用して将来の予測、行動の最適化を行うことが重要になっている」と畝見氏。一方で、AIが使われるようになったのは比較的最近で、扱うことができるのは一部の分析専門家やデータサイエンティストに限られていた。これを民主化するテクノロジーが拡張アナリティクスであり、これによりAIのセルフサービス化や民主化が促進される、と畝見氏は解説する。
なおAI民主化の形として、「ビジネスユーザー自身が効果的な洞察を獲得する」と「現場の分析担当によるAI実用化」の2種類があるという。前者は、一部の専門家でしか活用できなかったAIを各業務部門のユーザーが自身でより容易かつ自律的に活用し、より精度の高い意識決定と迅速なアクションにつなげることを目指すものだが、これまで一部の企業では誤解があったと畝見氏。
つまり、専門家が扱うPythonによるプログラミングやデータ加工などをビジネスユーザーも習得したり、機械学習モデルを自動生成するツールをビジネスユーザーに使ってもらうようにするという動きだ。だが、ビジネスユーザーは課題を解決するための効果的な洞察を必要としているだけであって、モデル開発や高い精度のモデルを必要としているのではない。このような状況に拡張アナリティクスは有用だという。
データ準備、探索、そしてモデル生成作業を自動化するSAS Viyaの拡張アナリティクス
SASはAIプラットフォーム「SAS Viya」で拡張アナリティクスを備えている。セッションで畝見氏は、分析業務プロセスの発見(ディスカバリー)フェーズをカバーするデータ準備作業の効率化・自動化の拡張アナリティクスとなる「Smart Data Transformations」、データ探索作業の効率化・自動化「Automated Visual Exploration」、モデル生成の自動化「Automated Machine Learning」、そしてモデル解釈情報を提供する「Built-In Interpretability」の4つをデモした。
発見フェーズの最初のステップとなるデータ準備は、データの収集、クレンジング、加工変換、モデル開発むけ学習用データ前処理などの作業が含まれる。データサイエンティストは実に、70%の時間をこの準備作業に費やしていると言われており、効率化が大きな課題となっていた。
SAS Viyaの拡張アナリティクス「Smart Data Transformations」は、この問題の解決を図るものだ。デモではローン審査業務で顧客ごとの債権不履行有無のデータに対してSmart Data Transformationsを用いることで、データソースを選択すると中身が画面に表示され、AIがデータの中身を自動でプロファイリングして探索し、その結果をビジュアルに表示したり、1クリックで登録済みのデータ準備に基づく分析を実行してデータ加工変換の推奨内容を提示するなどを見せた。
データ探索の拡張アナリティクス「Automated Visual Exploration」は単一画面でデータの探索、データマイニング、機械学習、評価を利用できるものだ。通常であれば試行錯誤を繰り返す作業を効率化できるという。データリスト画面内で変数を選択すると相関の強い変数を提示するなどのことも可能だ。
「異なる数値変数間の相関を捉えたい場合、これまでは散布図を描いたり、相関係数を計算して、その結果を表などで出力する必要があったが、そうした作業なしに変数間の相関を把握できる」と畝見氏は違いを説明する。
また、変数が増えるとどの変数をどのようなチャートで探索するのが最適なのかなど組み合わせは多数考えられるが、すべてを試すことはできない。現在は過去の経験に基づいて決め打ちで行っているが、Automated Visual Explorationでは変数、あるいは変数と変数の組み合わせに応じて最適なチャートやビューを提示してくれるという。
Automated Visual Explorationではまた、「AIストーリーテラー」という機能も紹介した。AIがデータの中身を解析し、機械学習モデルを構築し、そのモデルから得られた洞察を文章にするというものだ。
デモではターゲットマーケティングとして、予測モデルに基づく保険商品販売キャンペーンに反応する顧客を分析し、「1万9,000名中6,700名、34.64%の顧客が反応している」といった説明が表示され、合わせて反応フラグに影響及ぼす要因として「普通預金口座収支」「当座預金口座残高」といった変数の重要度をカラフルに表示したり、反応フラグと変数に該当するグループの関係の詳細もグラフィカルに示した。
また、最も反応している率が高いトップグループの条件に該当しながらも、いまだに反応していない顧客にアプローチするとどうなるのか、といった次のアクションにも簡単につなげることができるという。
モデル生成では、Automated Machine Learningを利用してわずか3ステップで精度の高いモデルを生成するためのパイプラインを自動生成して見せた。自動生成されたパイプラインはカスタマイズも可能という。モデル生成ではまた、解釈情報を自動取得できる拡張アナリティクスBuilt-In Interoperabilityも紹介した。
AI実用化の鍵を握るアナリティクス・ライフサイクル
このように、拡張アナリティクスによりデータを活用するための手段に過ぎないデータ準備、探索、モデル生成などの作業を自動化できる。そこでは、ビジネスユーザーは「収益を増やしたい」「コンバージョン率を高めたい」といった目的を伝えれば、後は全自動でAIが必要な分析やモデル生成を行い、ビジネスユーザーに洞察を示すという世界が実現しつつあるという。「拡張アナリティクスは分析業務に破壊的な変革をもたらす」と畝見氏。
AI実用化のための分析業務では、先述の「発見」(データ準備、データ探索、モデル生成)からモデル登録・管理を経て、「デプロイ」(モデル実装、モニタリング、モデル再学習)にいたるアナリティクス・ライフサイクルを回すことになるが、「現在企業はこのサイクルの多くを手作業で行っている」と畝見氏。
拡張アナリティクスを活用することで、このアナリティクス・ライフサイクルの発見フェーズを高速に、高い精度で回すことができる。加えて、開発されたモデルを実装するデプロイのフェーズを効率化し自動化する術も、SASでは提供している。
拡張アナリティクスは今後さらに発展していくが、当面のメリットとして「AIを活用したいが、AIがよくわからない業務部門で分析を担当しているビジネスユーザーによる自律的な分析が推進されるとともに、データサイエンティストの分析作業の効率化に役立てられる」と畝見氏は述べた。