「Teradata Aster MapReduce Appliance」は、リレーショナル・データベースと、MapReduce技術を統合した並列処理型のソフトウェアである「Aster」を、ハードウェアプラットフォームにあらかじめインストールした、ビッグデータ分析のためのアプライアンス製品だという。今回は英語バージョンで販売、出荷され、2013年初頭には日本語対応バージョンを販売、出荷する予定だとしている。
この製品は、ハードウェア構成として、4ノード、ユーザーデータ容量6.8TB(非圧縮)、管理ワークステーションを備え、ソフトウェア構成としては、Asterデータベース、ベースパッケージ(分析カテゴリーのパス/パターン、統計解析、関係性/グラフ、テキスト、データ変換に含まれる約30のSQL-MapReduce関数)を備えているという。
この製品の特徴として、SQL-MapReduceとSQL-Hの2つがあげられるという。SQL-MapReduceは、Webアクセスログ、テキストデータ、マシンセンサーログデータといった多構造化データを分析する際に、高頻度で利用される50以上のMapReduce処理を関数として事前にパッケージ化し、分析ユーザーがSQLの関数として呼び出せる機能だという。
これにより、多構造化データに対する並列分析処理を、SQL記述とほぼ同等のスキルで対話的、反復的に実施することができるという。また、Hadoop分散ファイルシステムに対しても、SQLおよびSQL-MapReduceで直接アクセス可能なSQL-H機能も提供される。分析ユーザーは、SQLおよびSQL-MapReduceを用いるだけで、構造化データと多構造化データの両方を扱うことが可能となるとしている。
従来、リレーショナル・データベースでは、データ操作に特化したSQLという平易な言語によって、分析担当者は対話的にデータ分析を行ってきたが、リレーショナル・データベースに格納されるデータは、あらかじめ定義された行と列のテーブル形式に構造化される必要があり、Webサイトのアクセスログ、テキスト文書、マシン・センサーログといった多構造化データの処理には不向きだったという。
また、オープンソースで提供されているHadoopは、多構造化データの並列処理フレームワークとしてMapReduceを提供しているが、MapReduceはJavaなどの開発言語を利用する必要があり、データ分析にはソフトウェア開発者と同等のスキルやプログラムの量が必要だったという。SQL-MapReduceは、このようなSQLおよびMapReduce双方の利点を含んだ技術であり、これにより、多構造化データの分析が容易に実現可能になるとしている。
■ニュースリリース
http://www.teradata-j.com/press/2012/20121011.html
■「Teradata Aster」の詳細
http://www.teradata-j.com/Aster/index.html