「Pivotal HD 2.0」は、オープンソースで開発が進むApache Hadoop 2.2をベースとして、SQL on Hadoop機能を提供する「HAWQ」の分析機能の強化を行い、さらに、インメモリ処理エンジンである「Pivotal GemFire XD」を統合したという。
これにより、ビッグデータ分析とリアルタイムでのファストデータ分析の両方を単一のHadoopプラットフォームで実現することが可能になるという。
「Pivotal GemFire XD」は、「Pivotal HD 2.0」上で稼働するファストデータ用インメモリ処理エンジンで、M2Mをはじめとするリアルタイムの大量データ処理など、今後、市場拡大が予想されるファストデータ戦略を実現するとしている。
「Pivotal GemFire XD」により、さまざまなシステムやデバイスが生成する大量データをリアルタイムに収集、インメモリ技術の活用により低レイテンシで分析業務を実施し、またバッチ処理などの後工程が必要なデータはHadoop環境に直接蓄積するなど、ビッグデータやファストデータを包括的に活用する環境を実装することが可能だとしている。
SQL on Hadoop技術である「HAWQ」は、「Pivotal HD 2.0」上で稼働する標準SQL対応の高速なデータベースエンジン。今回の分析機能の強化で、高度なオープンソースの数理分析ライブラリMADLibに含まれるアルゴリズムを広範にサポートした。
また、PL/R、PL/Java、PL/Pythonを使用し、ユーザ定義関数 (UDF) として利用することで、In-Database分析も可能。これらの「HAWQ」の分析機能強化により、分析アプリケーションに含まれるSQL資産や既存保有スキルを大規模並列分散処理のHadoop基盤に対しても容易に適用することが可能になるという。
なお、この製品は、EMCジャパンとその販売パートナーから販売される
【関連リンク】
ダウンロードサイト(英文)