今どきのデータ活用のサクセスにはクラウドツールが欠かせない
データ活用で得られる恩恵はあるものの、実現にはいくつかのハードルがある。例えば「統合的なデータ分析環境がない」「個人情報の取り扱いが難しい」「効果的な活用方法が見いだせない」など。2016年に発表された総務省の情報通信白書によると、「日本企業のデータ利活用は収集と蓄積の段階で止まっている」という指摘があり、今後、経済成長の中核となるのはAIを活用したデータ(ビッグデータ)の収集や活用とされている。
裏返すと、こうした課題解決にはビッグデータ、IoT、AIなどのデータをシームレスに統合したデータプラットフォームや分析基盤が必要であるということ。センシティブなデータを取り扱うためのセキュリティを確保した上で、現場のユーザーがデータ活用できるような環境が求められている。その上で、生産性向上やビジネス価値創出を実現できるソリューションを編み出していく必要がある。
「データ活用のサクセスキーは3つ」と日本マイクロソフト クラウドソリューションアーキテクト 大内山浩氏は言う。まずは「ヒト」と「プロセス」。「ヒト」とはデータ活用のためのスキルセットを保有する人材で、データサイエンスやデータエンジニアリングの知見だけではなくビジネスのスキルも必要だ。
「プロセス」とはデータ活用活動を効果的および効率的に進めるための方法論に相当し、CRISP-DM、KDDなどの汎用的なものや企業内での実績に裏打ちされたカスタムプロセスなどになる。ここまでは従来のITやデータ活用と共通している。大内山氏はもう1つ「クラウドツール」を挙げた。
クラウドへのシフトが進み、データ活用環境においてはモダンなクラウドツールをいかに活用できるかが生産性向上の鍵となる。そこで大内山氏は顧客企業における実体験から得た知見も交えながら、実際のデータサイエンスの現場で最新のクラウドツールやサービスがどのように活用されているかを示した。今回紹介するサービスはAzure Data Lake Storage、Power BI、Azure Databricks、Azure Machine Learning service、SQL Data Warehouseなど。