ビジネス価値を創出する「アナリティクス・ライフサイクル」
機械学習や人工知能(AI)、ディープラーニングなど、データ活用を取り巻く様々な言葉が巷にあふれている。冒頭で畝見氏はこれらの言葉について整理し、「それぞれが曖昧な範囲で互いに重複しあい、データを活用する分野や業界で呼び方が異なるだけ」と語る。そしてそれらをすべて包括するものが「アナリティクス」であり、旬の技術として注目を集める「AI」や「機械学習」もSASにしてみれば決して目新しいものではないという。
1976年創設のSASは42年にわたり、様々なアナリティクス関連の技術やソリューションを社会に提供し続け、豊富な実績と知見で知られる。畝見氏はForrester Wave*1やGartner*2がSASをアナリティクスのトップリーダーとして評価していることを示し、さらにIDCの調査*3でアドバンスド・アナリティクス/予測型アナリティクス分野におけるSASの2016年のマーケットシェアが30.5%で1位を獲得していることを紹介。「長きに亘り、アナリティクス分野を牽引してきた」と胸を張った。
そんなSASの顧客の多くは、既に機械学習や人工知能(AI)などの技術を用い、コストの削減や収益の拡大、リスクの低減など、ビジネス価値を創出しているという。そこでは「アナリティクス・ライフサイクル」がスムーズに回転しているのが特徴だ。それは、データをクレンジングするなどして準備し、探索・分析の上で予測モデルを生成し、業務へ実装してモニタリングによって改善していくという一連のサイクルである。
アナリティクス・ライフサイクルを分断する「分析スキルのサイロ化」
それでは、逆にこの「アナリティクス・ライフサイクル」の回転を阻害する原因とはなにか。その手がかりになるのが、AI&アナリティクス関連でデータサイエンティストとエンジニアが好んで使用しているプログラミング言語にあるという。2017年の調査「Results of the 2017 StackOverflow Survey」ではPhythonやJavaで4割以上、Rも1割が使用していると報告され、さらにここ数年で利用者数が急増している。しかし、その結果、言語ごとに分析スキルやナレッジが分断され、組織内で細分化してしまっているという。
畝見氏は「好みのオープンソース・プログラミング言語を使用した結果、サイロ化しているのが実態」と語り、「その結果、オペレーショナル化が困難となり、分析が単発に終止し、『アナリティクス・ライフサイクル』のスムーズな回転を実現できていない。また、既存の人材を有効に活用できず、異なるスキルをコラボレーションできないという状況に陥っている」と解説した。
この仕組みを支えるプラットフォームには、ビッグデータ対応やインメモリー処理といった「拡張性」、セキュリティやガバナンス、モデルの統合管理といった「信頼性」、そしてAI技術要素の網羅性やスキルレベルに応じたUIなどの「多様性」を担保する必要がある。もちろん複数の異なるベンダーのソリューションやオープンソース・ソフトウエアを組み合わせて、サイロ化した分析チームや人材をつなぎ合わせることもできるだろう。しかし、バラバラなツールや技術のつぎはぎをすればするほど、サイクルは遅くなっていく。それでは決して十分な成果に結びつけることができない。
となれば望むべくは、あらかじめすべての要素が統合され、アナリティクス・ライフサイクルを容易に実現できる環境だろう。それはすなわち「オープン・AIプラットフォーム」なのだ。