「Greenplum HD EE」は、Apache Hadoopとの互換性を維持しつつ革新的に再設計された実装を核に、インストール、トレーニング、導入から保守・運用に至るサポートなどを付加した包括的なHadoopプラットフォームだという。
「Greenplum HD EE」は、ビジネスインテリジェンスやデータ転送などのテクノロジを提供する多数のパートナーによる製品の認定を受けているという。それらの製品を活用することにより、リアルタイムなデータのやりとりを実現するほか、信頼性を向上させ、Hadoopのより容易な導入および活用を可能にするとしている。
「Greenplum HD EE」は、HDFS、MapReduce、Zookeeper、Pig、HiveおよびHbaseを含むApache Hadoopと100%のインターフェース互換性を有しているという。これにより、大規模な組織で必要とされる高度な機能を提供すると同時に、現在利用しているApache Hadoopの環境から、シームレスにアプリケーションの移植を行うことができるという。
発表によると、具体的な機能は次の通り。
・スナップショットやワイドエリアレプリケーションなどのデータ管理機能
・ネイティブのNFS(Network File System)インターフェースを使用したシンプルなデータロードおよびアクセス
・シンプルなクラスタの導入、自動障害検出/通知、マルチサイト管理、ローリングアップグレードなどのエンドツーエンドの管理性
また、「Greenplum HD EE」は、次のような機能により標準的なApache Hadoopに比べて2~5倍のパフォーマンス向上を実現しているという。
・各プロセスの再設計、最適化による高速化
・データルーティングテーブルによるロック競合の除去
・ステートマシンによるアプリケーション・スレッド競合の除去
・ロックおよびLinuxページ・キャッシュの不使用によるシャッフル処理の高速化
・分散NameNodeによる性能改善
・ビルトイン圧縮機能によるI/O処理の削減
・C/C++実装によるJavaガベージ・コレクションの削減
■製品の詳細
http://japan.emc.com/microsites/japan/techcommunity/sc/gp.htm