「Syncsort DMExpress」は、データ・ウェアハウスやデータ・マートの集約や、BIツール分析用のデータ加工を高速に行う超高速ETLツール。
開発生産性に優れ、複雑で高度な並列バッチ処理もGUIで簡単に実装でき、独自のアルゴリズムにより、CPU、メモリなどのリソースを有効活用しながら大容量データのソート、マッチング、集計処理などを高速で実行できるという。
「Syncsort DMExpress」バージョン7.15では、GUIで開発可能なジョブやタスク機能をすべてテキスト形式で作成できるDTL機能や、何の処理が行われているかをジョブエディタ上で記入できるコメント機能など、開発生産性、利便性を高める機能が追加されている。
また、OSS BIツールである「Tableau」データ形式への変換、JSONデータのCSV変換、JDBC接続のサポート、Vertica接続での特定カラムのデータ抽出やロードの高速化など、データの入出力部分が大幅に機能拡張されているという。
さらに、Hadoop関連の機能強化として、HadoopのHiveテーブルとの入出力だけでなく、Hadoop内外でGreenplumへの高速ロードに対応、HDFS(Hadoop Distributed File System)上のファイル内にあるデータのサンプリングも可能になるとしている。
この記事は参考になりましたか?
- 関連リンク
- この記事の著者
-
EnterpriseZine編集部(エンタープライズジン ヘンシュウブ)
「EnterpriseZine」(エンタープライズジン)は、翔泳社が運営する企業のIT活用とビジネス成長を支援するITリーダー向け専門メディアです。データテクノロジー/情報セキュリティの最新動向を中心に、企業ITに関する多様な情報をお届けしています。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア