データサイエンティストの“1人に1つ”のSpark環境を
「IBM Platform Conductorを使うことで、ITスキルの高くないような人にも、もっとSparkを使ってもらいたい」(髙田氏)
IBMでは、Sparkは使いたいけれどそのための足回りは触りたくないユーザーに、まずはすぐに使えるSpark as a Serviceを提供する。Spark利用の効果が認められ、企業内データで本格的な利用へと移行する段階となれば、IBMは企業のIT環境に応じた複数の製品を提供している。
1つ目は、前述のIBM POWERプロセッサーの高速性を生かしたアプライアンス製品「IBM Data Engine for Hadoop and Spark」、2つ目は、さらに柔軟性と拡張性の高いSparkのプライベートクラウド環境を構築できる「IBM Platform Conductor for Spark」だ。
また、企業の重要なデータの分析も視野に入れ、データサイエンティストや開発者がIBMメインフレームz Systems上のデータへリアルタイムかつセキュアに接続するためのz/OS Platform for Apache Sparkも提供している。
IBMは、企業でのSpark利用を推進するために、Spark利用の各段階における多様なユーザーニーズに応えるための選択肢を準備している。こうした対応からも、IBMの本気度を垣間見ることができる。
「ビッグデータ分析のニーズはあるけれど、実績のない新しいアーキテクチャとなる分散システムの導入をためらっている。そんな場合には、是非ともPlatform Conductorを検討してもらいたいです」(藤岡氏)
「人工知能や機械学習に興味があるような研究機関などにも、Platform Conductorで積極的にSparkを活用してもらいたいです」(髙田氏)
今後IBMでは、Sparkを使いこなすための教育にもさらに力を入れる。さらには、Platform Conductorを含むSparkのベストプラクティスといったものの情報も積極的に提供していく予定だ。
「これらのサービスを活用し、データサイエンティストの一人一人が、いつでも自分専用のSpark環境で分析できる環境を提供していく。これをIBMでは実現したい」と最後に藤岡氏は強調した。