30年間、一貫して我々はアナリティクスが得意なのだ
Teradataは、最初はレポーティングから始まり、それがエンタープライズ・データウェアハウス、そしてアナリティクスとなり、今ではビッグデータの活用へと発展を続けている。表す言葉は変化しているが、その根底にあるのはアナリティクスということ。そして、たんにその分野の製品を提供するだけでなく、この領域での30年の実績に基づくノウハウを多数持っており、それも含めたソリューションとして提供する。それが、今もなお世界を対象としたビジネスで、2桁の成長を誇っている源泉でもある。
日本テラデータ 代表取締役社長の吉川幸彦氏は「2012年は表面的には大きな変化はなかったが、データ活用の転換期となった1年でした」と言う。そして、Teradataのビジネスが成長し続けている理由を次のように説明した。たとえば、米国ではさまざまな経済危機もあり、企業のIT予算は削減傾向にある。一方で予算は少ないけれど、データをさらに高度に活用し他社と差別化し競合優位性を得たいという要求もある。この両方のニーズに応えることができるのが、Teradataだからだと。そして「この米国での流れは日本にもやってくる」とも言う。
転換期に入り、データ活用の主体がIT部門からビジネス部門に移り始め、全社レベルでデータを統合し活用したいというニーズも出てきている。そして、「ビッグデータは、バズワードの部分もありますが、大企業などのトップの人たちに、社内でのデータ活用を浸透させたという貢献もあります」と吉川氏。これが、ここ最近巻き起こっている、トップダウンで企業のデータ活用検討のきっかけとなっているのだ。
Teradata Unified Data Architectureはビッグデータ活用の基盤アーキテクチャ
それではTeradataは、改めて現状のビッグデータというものをどう捉えているのだろうか。ウィマー氏は「重要なのはデータがあることではなく、それを解釈しビジネスに影響を及ぼすことです。そのためには、ビッグデータを扱うためのしっかりした基盤が必要です」と言う。そして、このビッグデータ活用の基盤となるアーキテクチャとして今回発表されたのが、「Teradata Unified Data Architecture(Teradata UDA)」というわけだ。
Teradata UDAは、従来のTeradataが得意とするSQLを使った大容量データの分析、そしてTeradata Asterが得意とする非構造データなど新たなデータタイプ、そして大容量のデータを収集し、蓄積し加工するのに向いているHadoopの世界、これら3つに対してアクセスし、データを移動し、管理するとためのアーキテクチャだ。言い換えればそれぞれのプラットフォームの間を埋めていくためのさまざまな仕組み群でもある。
Teradata UDAは、あくまでもアーキテクチャだ。なので、こういう名称の製品が新たに登場したわけではない。システム間をつないだり、連携させたりするための既存の仕組みもあれば、今回新たに追加されたものもある。このアーキテクチャが目指すところは「Any user, Any data, Any analysis」。Teradata、Teradata Aster、Hadoopが一体となってこれを目指す。
データへのアクセスでは、SQL-Hという機能を提供する。これは、ビジネスユーザーがSQLを使ってHadoopに簡単にアクセスするためのものであり、既存のBIツールを使って自らHadoopのデータを分析できる。Hadoopディストリビューションの1つであるHortonworksのHCatalog(Hadoop内にあるメタデータのようなもの)を利用しており、あらかじめ用意されている70種類を超えるSQL-MapReduceアプリケーションを利用可能だ。
もう1つのアクセス機能が、Connectorsだ。Aster Teradata Connector、Aster Connector for Hadoop、Teradata Connector for Hadoopが用意されており、Teradata、Teradata Aster、Hadoopの動いているサーバー間を相互に接続するものだ。ちなみに、ここで利用するHadoopはHortonworks、Cloudera、Apache Hadoopなどどのディストリビューションにも対応している。
データの移動としては、Smart Loader for Hadoopが用意されている。これを使うことで、TeradataからHadoop、HadoopからTeradataという双方向でのデータローディングが実現できる。Hadoopの接続は、2013年の第2四半期に提供される予定のTeradata Studioを利用することで、ドラグ&ドロップで可能となる。
また、3つの環境を管理するためには、Teradataの管理ツールであるViewpointを利用する。Teradata Aster、Hadoopにも対応しており、システムの稼働監視や領域管理など、必要な管理作業を一元的に行える。このように、3つのビッグデータ活用の基盤要素を連携させ有効に利用するために必要な、さまざまな機能を提供するのがTeradata UDAだ。現時点でこれは、完成しているものではない。今後もさらに拡張が続けられ、成長していくアーキテクチャだ。
そして、このTeradata UDAに基づいてTeradata AsterとHadoopを1つの筐体に共存させた新たなアプライアンス製品がTeradata Aster Big Analytics Applianceだ。1台の筐体に最大18台のノードを搭載することができ、ユーザーの要望に応じてAsterとHadoopを組み合わせて搭載できる。内部的にはノード間は40GB/sのInfiniBandのインターコネクトで接続されるので、Aster、Hadoop間のデータへのアクセス、移動も高速に実現できる。
Teradataは今後、このTeradata UDAに基づいて製品を提供していくことになるだろう。ビッグデータ活用のための特別なNoSQLデータベースだったHadoopが、リレーショナルデータベースの世界とアプライアンスという形でもどんどん融合化していく。バズワードの時代から、適材適所でビッグデータテクノロジーを活用する段階へと、確実にステップアップしていることが伺われる。