「Syncsort DMExpress」は、データ・ウェアハウスやデータ・マートの集約や、BIツール分析用のデータ加工を高速に行う超高速ETLツール。
開発生産性に優れ、複雑で高度な並列バッチ処理もGUIで簡単に実装でき、独自のアルゴリズムにより、CPU、メモリなどのリソースを有効活用しながら大容量データのソート、マッチング、集計処理などを高速で実行できるという。
「Syncsort DMExpress」バージョン7.15では、GUIで開発可能なジョブやタスク機能をすべてテキスト形式で作成できるDTL機能や、何の処理が行われているかをジョブエディタ上で記入できるコメント機能など、開発生産性、利便性を高める機能が追加されている。
また、OSS BIツールである「Tableau」データ形式への変換、JSONデータのCSV変換、JDBC接続のサポート、Vertica接続での特定カラムのデータ抽出やロードの高速化など、データの入出力部分が大幅に機能拡張されているという。
さらに、Hadoop関連の機能強化として、HadoopのHiveテーブルとの入出力だけでなく、Hadoop内外でGreenplumへの高速ロードに対応、HDFS(Hadoop Distributed File System)上のファイル内にあるデータのサンプリングも可能になるとしている。