PARTNERS開催に先立つ10月17日、テラデータは分析アプライアンスの新製品「Teradata Aster Big Analytics Appliance」を発表している。昨年買収したAster Dataのデータ分析技術とHadoopを融合した製品で、MapReduceとSQLをともにサポートする点が特徴だ。Intel Xeonプロセッサを搭載した筐体にはOSにはSUSE Linux 11が稼働しており、内部接続は40Gb/sのInfiniBandで行われている。
メインとなるデータベースはAster Database 5。Aster Dataが開発したAster SQL-HおよびAster SQL-MapReduceという技術により、構造化データ/構造化データを問わず、迅速なデータ分析を可能にしている。とくに、HadoopのメタデータカタログであるHCatalogを活用して、HadoopにストアされたデータへのSQLアクセスをシームレスに実現するSQL-Hが、構造化データと非構造化データをつなぐブリッジの役割を果たしている点が注目される。既存のBIアプリケーションとの連携も問題ない。事前定義されたMapReduce分析アプリケーションの数も50以上にのぼるという。
もうひとつの注目ポイントはHadoopディストリビューションとしてHortonworksのHDP 1.1が稼働している点だ。Hortonworksを選択した理由として、Asterの共同プレジデントを務めるタッソ・アグロス(Tasso Argyros)氏は「HortonworksはApache Hadoopと100%互換を実現する唯一のエンタープライズ向けディストリビューションであり、加えて、高可用性、テラデータ製品との相性の良さなども高い評価を得た」と説明する。また、HCatalogプロジェクトに対するHortonworksの貢献度の高さも決め手のひとつとなったという。
この新アプライアンスの目的は、当然ながらあらゆるデータを迅速に分析することに尽きる。タッソ氏は「Hadoopはデータの収集やローディングはたしかに速い。だが分析は速いとは言いがたい。一方でAsterは分析に威力を発揮する。両方のいいとこ取りをしたマシンがTeradata Aster Big Analytics Appliance。ユーザが求めているの速いHadoopマシンではなく、速い分析環境だ」と語る。
ブロブストCTOは同じセッションで「私は"非構造化データ"という言葉が大嫌いだ」とも言い切っている。
すべてのデータは構造化データであり、非構造化データと呼ばれているものも構造化データに落とすことができる多構造化データであるというのが同氏の主張だ。
「データはデータでしかない。リレーショナルかそうでないかだけで構造化/非構造化と区別するのは馬鹿馬鹿しい」とする同氏だが、Aster Dataはもともと、構造化/非構造化でデータを分類するよりも、SQLとメタデータの有無を重要視してきたことが競合製品と大きく異なっている。
Hadoopと既存データベースを接続するコネクタは各社から出ており、タッソ氏によれば、下記のように分類されるという。
- No SQL/No Metadata … Cloudera Sqoop、Oracle Loader for Hadoop
- SQL/No Metadata … Greenplum External Tables、Oracle HDFS Direct Connector
- SQL/Metadata … Aster SQL-H
この違いに注目してきたからこそ、逆に構造化/非構造化データを問わない分析プラットフォームを作ることができたといえる。
ビッグデータはひとつの技術として語られがちだが、実際にはデータの収集やストアにはじまり、クレンジングやフィルタリング、結合、アグリゲーションなどのプロセスを経てようやく分析に至る。このサイクルを速くするには、データのタイプやワークロードに応じた適切なアプローチが求められる。
そして1台でこれを実現できるのはTeradata Aster Big Analytics Applianceとするテラデータ。Oracle ExadataやSAP HANAと異なり、テラデータはOLAPだけに特化した製品を世に送り続けている。ある意味、DWH専業ベンダの意地が結集したとも言える新アプライアンスが市場でどんな地位を獲得できるのか、今後の事例に注目していきたい。