EnterpriseZine(エンタープライズジン)

EnterpriseZine(エンタープライズジン)

テーマ別に探す

標準的なApache Hadoopに比べて2~5倍のパフォーマンス向上 EMCジャパン、ビッグデータを分析処理する次世代Hadoop「EMC Greenplum HD EE」の販売を開始

  2012/01/19 00:00

EMCジャパンは、大規模データの分散アプリケーションに使用されるオープンソースソフトウェアであるApache Hadoopと100%の互換性を有し、ビッグデータを超高速に分析処理する「EMC Greenplum HD Enterprise Edition(Greenplum HD EE)」の販売を1月19日から開始すると発表した。

「Greenplum HD EE」は、Apache Hadoopとの互換性を維持しつつ革新的に再設計された実装を核に、インストール、トレーニング、導入から保守・運用に至るサポートなどを付加した包括的なHadoopプラットフォームだという。

「Greenplum HD EE」は、ビジネスインテリジェンスやデータ転送などのテクノロジを提供する多数のパートナーによる製品の認定を受けているという。それらの製品を活用することにより、リアルタイムなデータのやりとりを実現するほか、信頼性を向上させ、Hadoopのより容易な導入および活用を可能にするとしている。

「Greenplum HD EE」は、HDFS、MapReduce、Zookeeper、Pig、HiveおよびHbaseを含むApache Hadoopと100%のインターフェース互換性を有しているという。これにより、大規模な組織で必要とされる高度な機能を提供すると同時に、現在利用しているApache Hadoopの環境から、シームレスにアプリケーションの移植を行うことができるという。

発表によると、具体的な機能は次の通り。

・スナップショットやワイドエリアレプリケーションなどのデータ管理機能
・ネイティブのNFS(Network File System)インターフェースを使用したシンプルなデータロードおよびアクセス
・シンプルなクラスタの導入、自動障害検出/通知、マルチサイト管理、ローリングアップグレードなどのエンドツーエンドの管理性

また、「Greenplum HD EE」は、次のような機能により標準的なApache Hadoopに比べて2~5倍のパフォーマンス向上を実現しているという。

・各プロセスの再設計、最適化による高速化
・データルーティングテーブルによるロック競合の除去
・ステートマシンによるアプリケーション・スレッド競合の除去
・ロックおよびLinuxページ・キャッシュの不使用によるシャッフル処理の高速化
・分散NameNodeによる性能改善
・ビルトイン圧縮機能によるI/O処理の削減
・C/C++実装によるJavaガベージ・コレクションの削減

■製品の詳細
http://japan.emc.com/microsites/japan/techcommunity/sc/gp.htm
 

著者プロフィール


All contents copyright © 2007-2020 Shoeisha Co., Ltd. All rights reserved. ver.1.5