データレイクの活用ではオープンソース・ソフトウェアは欠かすことができないものに
「ビッグデータの世界では、どんどんエコシステムが充実してきています。たとえば、2009年のHadoopを取り巻く世界と2017年のそれとでは、状況が大きく変わっているのです。当初はもちろん、Sparkは存在すらしていませんでした。オープンソース・ソフトウェアは、いまやデータレイクを実現するためになくてはならないものになっています」
こんな発言をしているのがHadoop関連のディストリビューターに所属する誰かであればなんら驚くことではないだろう。ところがこう語っているのは、独自性の強いデータベース製品で名を馳せているテラデータの中で、ビッグデータのコンサルティングサービスを提供する組織「Think Big Analytics」のクライアント・サービス ディレクターであるマシュー・マックデビット氏なのだ。
テラデータのアナリティクス領域のソリューションとしては、2008年にリアルタイム・データウェアハウジングおよびBIコンサルティングの「クララビュー社」を買収するところから始まった。2010年にはHadoopの開発に携わった2人の創業者により「Think Big Analytics」が設立された。同年には、これも後に買収することになる英国のビッグデータ技術の専門会社「Big Data Partnership」が設立される。
Think Big Analyticsでは、世の中でデータレイクという言葉が使われる以前から、顧客がデータレイク的なものを構築するためのコンサルティングサービスを提供してきた。そして2014年になりThink Big Analyticsをテラデータが買収、2015年にはThink Big Analyticsの技術を活用するアナリティクス・ビジネス・コンサルティングのビジネスを開始する。そして欧州でのサービス拡充を目指し、2016年には前述のBig Data Partnershipを買収しThink Big Analyticsの部隊に融合した。
ビッグデータのコンサルティング・サービスなどを次々と買収し、Think Big Analyticsを中心に強化してきたテラデータ。そんな同社のビッグデータ・コンサルティングサービスの強味の1つが、オープンソース・ソフトウェアを活用することだ。テラデータがなぜオープンソース・ソフトウェアに力を入れるのか。
テラデータはこれまで、基幹系システムから生まれるデータを集めるデータウェアハウスを構築するなどで、顧客のビジネスの中で生まれる知見の活用に注力してきた。これは、今後も引き続き同社のビジネスの中心であることは間違いないだろう。それに加えて、現状ではもっと広い視野でデータを集め、アジャイル的にそれを活用したいという動きも出てきている。この新しい動きの部部の実現には、オープンソース・ソフトウェアが欠かせないと判断しているとマックデビット氏は言う。
Think Big Analyticsでは、「Think Big Velocity サービス・ポートフォリオ」として、データサイエンス、マネージドサービス、トレーニング、データレイクサービス、アナリティクスソリューション、戦略&アーキテクチャといったビッグデータ活用のためのサービスをフルスタックで提供する。これらを提供する際に、Think Big Analyticsには方法論を持って居る。それを使い、まずは6週間程度とあまり長い時間をかけずにサービスを提供する。これはPoCのような事前評価のための取り組みではなく、アウトプット(成果)の出るコンサルティングサービスとして提供されるものだ。
「たとえば、ビデオ画像の中から人やクルマを検出するプロジェクトもあります。これではオープンソース・ソフトウェアをベースにした深層学習を活用していますが、一方でTeradataやAsterなど既存のテラデータの技術は使っていません」(マックデビット氏)
こういった取り組みは従来テラデータが得意としてきたデータウェアハウスの延長線上にあるものではない。とはいえ、後々ここから企業のビジネスへと発展させていくとなれば、データウェアハウスと融合させたデータ分析も必要になるはずだ。そういったところも見据えてコンサルティングを行えるのが、Think Big Analyticsのサービスの強味となるのだろう。