テクノロジーが進歩しても変わっていないデータ分析の理想と現実
西内氏が2010年に大学の教職を辞し、2014年のデータビークル創業を経て今に至るまでの約10年間、企業からの相談内容はほとんど変わらないという。それは端的に言えば、図1に示す「データ」「分析」「意思決定」「現場」のライフサイクルをうまく回したいということだ。
ところが、現実にはどこかのプロセスがうまくいかない。多くの場合、「データが利用できない」「高度な分析手法を使っているが意思決定の役に立たない」「見える化しか意思決定に役立てられない」「現場がやりっぱなしで効果があったかどうかがわからない」のどれかに当てはまることが多いという。データを活用したいのにうまくいかない場合、どこかで止まっているからで、データサイエンティストを採用できないことや高機能なツールを調達できないことだけが理由ではないというのが西内氏の見立てだ。
一口にデータ分析と言っても、目的により異なる。西内氏はガートナーの分類を引用し、データ分析には、過去に何が起きたのかを把握する「記述的分析」、なぜ起きたのか(理由)を明らかにする「診断的分析」、将来何が起きるのかを予測する「予測的分析」の3つがあると述べた。
通常、記述的分析のために導入されるのがBIツールである。BIツールは可視化を得意としているが、現状を素早く理解できるというメリットの裏返しで、経験と勘の裏づけにしかならないことも多い。AIは予測的分析には適用できるが、何をしたらいいかまでは教えてくれない。例えば、購買履歴からある人が年間5万円ぐらい購入してくれそうだと予測できたとしても、どうすればもっと購入してくれるのかまではわからないのだ。
「実は、何をすればどのぐらい儲かりそうかというアイデアを得るには診断的分析が役立つことが多い」と西内氏は語る。「イメージを変えれば」「職員研修を変えれば」「特定の立地に出せば」どのぐらい儲かるか。このようなアイデアを発見するためには、 通常SASやSPSSのような高度な解析ツール、ツールを使いこなせるデータサイエンティストの確保、分析環境構築などを含めるとプロジェクト予算が1億円を超えることも珍しくない。しかもそこまで高額な投資をしても、依頼した企業側から見ると報告書の中にはわかりきったことしか書かれていないことがしばしば起こる。この問題の解決が難しいのは、分析担当者と意思決定者、あるいは現場担当者の間にギャップがあるためだ。