Shoeisha Technology Media

EnterpriseZine(エンタープライズジン)

EnterpriseZine(エンタープライズジン)

テーマ別に探す

「分析スキルのサイロ化」がアナリティクス・ライフサイクルを分断させている――SAS 畝見真氏

edited by DB Online   2019/01/15 08:00

 AI/機械学習を活用したビジネス価値創出に不可欠とされる「アナリティクス・ライフサイクル」。利益を生み出すためには、データを準備し、予測モデルを開発し、業務に実装する、というサイクルをすばやく回し続けることが重要だ。そのために必要な組織内の分析者などの連携を実現するAIプラットフォーム「SAS Viya」について、SAS Institute Japanビジネス開発グループ エバンジェリストの畝見 真氏が解説した。

ビジネス価値を創出する「アナリティクス・ライフサイクル」

 機械学習や人工知能(AI)、ディープラーニングなど、データ活用を取り巻く様々な言葉が巷にあふれている。冒頭で畝見氏はこれらの言葉について整理し、「それぞれが曖昧な範囲で互いに重複しあい、データを活用する分野や業界で呼び方が異なるだけ」と語る。そしてそれらをすべて包括するものが「アナリティクス」であり、旬の技術として注目を集める「AI」や「機械学習」もSASにしてみれば決して目新しいものではないという。

SAS Institute Japan ビジネス開発グループ エバンジェリスト 畝見 真氏

 1976年創設のSASは42年にわたり、様々なアナリティクス関連の技術やソリューションを社会に提供し続け、豊富な実績と知見で知られる。畝見氏はForrester Wave*1やGartner*2がSASをアナリティクスのトップリーダーとして評価していることを示し、さらにIDCの調査*3でアドバンスド・アナリティクス/予測型アナリティクス分野におけるSASの2016年のマーケットシェアが30.5%で1位を獲得していることを紹介。「長きに亘り、アナリティクス分野を牽引してきた」と胸を張った。

*1:Forrester Wave: Predictive Analytics And Machine Learning Solutions, Q1 ‘17
*2:On February 9, 2016, Gartner Inc. published its third Magic Quadrant for Advanced Analytics Platforms
*3:IDC : Worldwide Advanced and Predictive Analytics Software Revenue by Vendor 

 そんなSASの顧客の多くは、既に機械学習や人工知能(AI)などの技術を用い、コストの削減や収益の拡大、リスクの低減など、ビジネス価値を創出しているという。そこでは「アナリティクス・ライフサイクル」がスムーズに回転しているのが特徴だ。それは、データをクレンジングするなどして準備し、探索・分析の上で予測モデルを生成し、業務へ実装してモニタリングによって改善していくという一連のサイクルである。

出所:SAS Institute Japan 株式会社[画像クリックで拡大表示]

アナリティクス・ライフサイクルを分断する「分析スキルのサイロ化」

 それでは、逆にこの「アナリティクス・ライフサイクル」の回転を阻害する原因とはなにか。その手がかりになるのが、AI&アナリティクス関連でデータサイエンティストとエンジニアが好んで使用しているプログラミング言語にあるという。2017年の調査「Results of the 2017 StackOverflow Survey」ではPhythonやJavaで4割以上、Rも1割が使用していると報告され、さらにここ数年で利用者数が急増している。しかし、その結果、言語ごとに分析スキルやナレッジが分断され、組織内で細分化してしまっているという。

 畝見氏は「好みのオープンソース・プログラミング言語を使用した結果、サイロ化しているのが実態」と語り、「その結果、オペレーショナル化が困難となり、分析が単発に終止し、『アナリティクス・ライフサイクル』のスムーズな回転を実現できていない。また、既存の人材を有効に活用できず、異なるスキルをコラボレーションできないという状況に陥っている」と解説した。

出所:SAS Institute Japan 株式会社[画像クリックで拡大表示]

 この仕組みを支えるプラットフォームには、ビッグデータ対応やインメモリー処理といった「拡張性」、セキュリティやガバナンス、モデルの統合管理といった「信頼性」、そしてAI技術要素の網羅性やスキルレベルに応じたUIなどの「多様性」を担保する必要がある。もちろん複数の異なるベンダーのソリューションやオープンソース・ソフトウエアを組み合わせて、サイロ化した分析チームや人材をつなぎ合わせることもできるだろう。しかし、バラバラなツールや技術のつぎはぎをすればするほど、サイクルは遅くなっていく。それでは決して十分な成果に結びつけることができない。

 となれば望むべくは、あらかじめすべての要素が統合され、アナリティクス・ライフサイクルを容易に実現できる環境だろう。それはすなわち「オープン・AIプラットフォーム」なのだ。

出所:SAS Institute Japan 株式会社[画像クリックで拡大表示]

ユーザーに応じて適切なデータ活用環境を提供する「SAS Viya」

 「アナリティクス・ライフサイクル」のスムーズな回転を実現するオープン・AIプラットフォームとして、『SAS Viya』が紹介された。

 『SAS Viya』は企業内に散在するデータや分析スキル、ナレッジなどの統合管理・共有・活用を実現する。オンプレミス環境はもとより、パブリック/プライベート/ハイブリッドのクラウド上で稼働でき、RDB、Hadoop、ストリーミングなどあらゆるデータソースに対応している。それらを整頓して、インメモリー分析エンジンで高速に解析・モデリングし、ビジネスプロセスへと実装するという「アナリティクス・ライフサイクル」をスムーズに回すことが可能だ。

 分析にプログラミングを好むならPythonやRなどの汎用プログラミング言語から必要に応じて『SAS Viya』のAIライブラリを使用できるので、大量データに対する高速なモデリングも容易にできる。さらに出来上がったモデルはすべてリポジトリで統合管理され、再利用や共有が可能だ。またプログラミングスキルをもたないユーザーのためにも、視覚的なUIが用意されている。

出所:SAS Institute Japan 株式会社[画像クリックで拡大表示]

 さらに有用なのが、分析者のスキルに応じて選べる、オープンなインタフェイスだろう。分析エンジンと使用言語は1対1で対応していることが多く、異なる言語を使うユーザーが、同じ環境を利用することは困難だった。しかし、『SAS Viya』では分析エンジンと言語を分離することで、データサイエンティストはPythonやRなどを使用するプログラミング・インターフェース を、アプリケーション開発者はREST APIに対応するAPI インターフェース というように、それぞれ使いたい言語で使用できる最適なインタフェイスを選ぶことができる。また、ビジネスアナリストや一般のビジネスユーザーなどコーディングスキルを持たないユーザーのためにもビジュアル・インタフェイスが用意されており、エンジニアのサポートなくとも自身の手で分析や結果の閲覧などが可能だ。

 他にも多様で豊富なAI&アナリティクス機能として、教師なし学習の「探索」、教師あり学習の「予測モデリング」および、自動チューニング機能を備えた「ディープラーニング」、そして「自然言語処理」や「画像処理」、「フォーキャスティング」「計量経済分析」「最適化」などが網羅的に実装されている。

出所:SAS Institute Japan 株式会社[画像クリックで拡大表示]

 そして、アナリティクス・ライフサイクル全体を単一プラットフォーム上の統合GUI環境だけで実現できることもデータ活用における迅速性を高めるに違いない。「統合グラフィカル・ユーザー・インターフェース」ではデータの管理・準備、探索・分析から、モデルの生成、モデルの管理・実装・評価までをすべて1つのインタフェイスで操作できるようになっている。

アナリティクス・ライフサイクルの全プロセスをトータルに支援

 さらに統合グラフィカル・ユーザー・インターフェースを用いて、アナリティクス・ライフサイクルの各フェーズにおける「SAS Viya」の具体的な活用が紹介された。アナリティクス・ライフサイクルは、「Data」「Discovery」「Deployment」という3つのプロセスで構成されている。

 まず事前のデータ準備を行なう「Data」では、通常2つの方法が考えられる。情報システム部門が用意するDWHやデータマートを活用する方法と、セルフサービス型で実行する方法だ。しかし、前者では必ずしも望むようなデータになっているとは限らない。そこで、分析要件ごとに異なるデータが必要になるたびに、自ら簡単に準備できる環境が必要というわけだ。「SAS Viya」では、データのプロファイリングからクレンジング、加工・変換・結合といった一連の作業を、分析者自身がGUIベースで行なえる。

 次に「Discovery」の最初のタスクは、準備したデータの探索・分析だ。ここでもマウス操作で過去のデータや高度な機械学習を用いることができ、結果が自動的にビジュアライズされる。それをダッシュボードとして共有することも可能だ。また簡単な操作で、ビジュアル・パイプラインを用いて、機械学習・時系列予測・テキスト解析モデルを生成できる。テンプレートも用意されているので、容易に高精度な予測モデルを自動生成することが可能だ。なお、金融業の与信のように予測モデルをホワイトボックス化することが求められるケースもある。そこで業務要件に応じたモデリングのブラックボックス化、ホワイトボックス化が選べる仕様になっているという。

 ここで通常ブラックボックス化しがちな機械学習やディープラーニングの判断根拠を可視化する手法などが紹介された。機械学習のモデル内容の説明や結果の解釈のために3つの手法(PD, ICE, LIME)が用意されている。また、ディープラーニング(CNN)による画像認識の判断根拠に関しても、カラフルなヒートマップを出力し、入力画像のどこに着目して判断を下したのかを容易に確認することもできる。説明責任が求めれらるような業務要件において、これらの機能は強力な武器となるだろう。  

 そして最後の「Deployment」では、作成したモデルを統合的に管理した上で、スピーディにビジネスプロセスに実装できる点が強みとなる。これからの時代、データはもとより予測モデルは企業の重要な資産となるのは明白だ。『SAS Viya』では、モデルのバージョン管理や業務プロセスへの実装、そして実装後の精度のモニタリングなどを容易に実現可能となる。

 さらに通常であれば本番環境で、モデルにあてはめるデータをデータベースなどから取得して来る必要があるが、それが膨大だった場合、取得やデータ転送に時間がかかりすぎる可能性がある。そこで、データのある場所(データベース)や、IoTなどデータが発生するところにモデルを配置し、その中でスコアリングを実行可能だ。

 畝見氏はこれらについてデモンステーションを行なってみせた。そして、改めてアナリティクスのスキルやナレッジ、環境がサイロ化していることの問題とその解決策としてのオープン・AIプラットフォーム『SAS Viya』の有用性を強調し、セッションを終えた。

SAS Institute Japanの関連ホワイトペーパー公開中!

 
経営幹部に必要な「アナリティクスライフサイクル」の知見をケーススタディで学ぶ!
詳細&資料ダウンロードはこちら!
 
注目資料「オープン・エコシステムにおいてSASを利用する利点」 

著者プロフィール

  • DB Online編集部(ディービーオンライン ヘンシュウブ)

    DB Online編集部 翔泳社 EnterpriseZine(EZ)が提供するデータベース/データテクノロジー専門メディア「DB Online」編集部です。皆様からの情報お待ちしています。 Twitter : https://twitter.com/db_online Fac...

  • 伊藤真美(イトウ マミ)

    フリーランスのエディター&ライター。もともとは絵本の編集からスタートし、雑誌、企業出版物、PRやプロモーションツールの制作などを経て独立。ビジネスやIT系を中心に、カタログやWebサイト、広報誌まで、メディアを問わずコンテンツディレクションを行っている。

All contents copyright © 2007-2019 Shoeisha Co., Ltd. All rights reserved. ver.1.5