「ビッグデータ・クレンジングパッケージ」は、分析用データを蓄積する基盤として活用が広がっている「MapR Enterprise Edition (M5)」、MapR Hadoopに最適なIAサーバ「HP ProLiant DLシリーズ」、高速かつ容易にデータを収集、加工できるETLツール「Syncsort DMX-h」、さらに各種技術支援サービスを組み合わせて提供するもの。
これにより、さまざまなデータから価値あるデータを提供するスケーラブルなシステム基盤を構築することが可能となり、データウェアハウスの価値を最大化するとしている。
このソリューションの特徴は次のとおり。
・データベースのライセンスコストやストレージコストを低減:「MapR Enterprise Edition (M5)」とコモディティサーバをSDS(Software Defined Storage)として活用することで、データベースのライセンスコストおよびストレージコストを低減。
・データ収集や加工といったデータクレンジングコストを低減:GUIによる直観的な操作でデータクレンジング処理を開発することで、作業コストを低減。また、スケーラブルな分散環境に対応した高速ETL処理により、処理コストを低減。
また、アシストでは、「ビッグデータ・クレンジングパッケージ」の提供開始に合わせ、1月21日より「MapR版Syncsort DMX-h Sandbox(トライアルキット)」のダウンロード提供を開始している。「Syncsort DMX-h」とマップアール・テクノロジーズ提供の「MapR」を同梱したVMWare Player用仮想マシンで、自社にHadoop環境がなくてもHadoop上でビッグデータをクレンジングするためのETL処理の開発と実行を体験できる。
トライアルキットに含まれるサンプルのデータとアプリケーションで、売上集計、差分抽出、Webログ集計、文字列カウントの4つのジョブをチュートリアルに沿って実行することも可能だという。