2025年1月9日、CData Software Japan(CData)は、「CData Sync」の新バージョン、V24.3をリリースした。
CData Syncは、基幹システムなどで使われているオンプレミスDBやSalesforce、kintoneといったSaaSデータを、データ分析基盤にノーコードでパイプラインできるETL/ELT ツール。CData Sync V24.3では、以下のような機能強化を行ったという。
「拡張型CDC(変更データキャプチャ)機能」の追加
CData SyncのPostgreSQL、Oracleデータソースにおいて、リアルタイムデータストリームに対応したCDC機能が追加された。この機能は、データソース側の変更履歴やトランザクションログを常時監視し、変更が発生するとリアルタイムストリーミングで変更データを収集。PostgreSQLを使用した従来版と最新版の比較テストでは、拡張型CDCを使用することで、標準的なケースで処理時間の90%を超える削減を確認したという。今後、サポート対象のデータベースを順次拡大していくとのことだ。
なお、リアルタイムでのデータ取得を実現したことで、最新データに基づいたアクションが可能に。CData Sync側でのデータソースからのデータ取得はリアルタイムに行いつつ、レプリケーション先への反映を任意のタイミングで行うことも可能だという。また、以前のCDC機能と比較して、データソースDB側への負荷を軽減しているため、基幹システムなどの連携に適用しやすくなっていると同社は述べている。
リバースETL機能の接続先拡充
リバースETL機能を拡充。従来のCData SyncのリバースETL機能は、書き戻し先の対象をSalesforceとし、データソースはSnowflake、SQL Server、PostgreSQLを対象としていたという。今回のアップデートで、書き戻し先にDynamics 365(Sales・Customer Service系モジュール、Dataverse)を加えているとのことだ。また、リバースETLが可能なデータベースとして、新たにGoogle BigQueryとAmazon Redshiftを追加したという。
既存コネクタの機能を強化
既存コネクタに対して、改修・改良を実施。代表的なアップデートは以下のとおり。
SnowflakeのVariant型対応と大規模データ連携時のパフォーマンス向上
SnowflakeでのVariant型を用いたJSONデータのレプリケーションに対応。また、Snowflakeへの大規模データの連携パフォーマンスを向上させたという。社内テストでは、100万件規模のデータの同期速度が200%向上したことが確認されたとのことだ。
BigQueryでのマルチバイト文字を使用したカラムへのレプリケーション対応
CData SyncからBigQueryにレプリケーションする際、マルチバイト文字を含んだカラム名を変換・変更なしで同期できるようになったという。従来、kintoneなどのようにデフォルトで日本語名カラムを含んだアプリケーションからBigQueryにレプリケーションする際には、対象のカラム名を変換する必要があったが、今回のアップデートからこの変換が不要になったとしている。
Dynamics 365(Sales・Customer Service 系モジュール、Dataverse)で変更データキャプチャ利用時でもHistory modeが利用可能に
History modeは、データソース側で発生した変更を上書きせず、履歴として管理をする仕組み。この機能は、監査向けにデータの変更を追跡しておきたい場合や、データを時系列的に分析したいといった際に必要な機能だという。
上記以外に行われたアップデートは以下のとおり。
- カスタムロール機能を追加:ジョブ単位での権限設定に対応し、ユーザーごとに閲覧・編集が可能なジョブを管理できる
- メタデータキャッシュコントロールを変更:各ジョブの作動直前にメタデータを取得する挙動に変更。これにより、データ連携のリアルタイム性を強化した
- コメント機能の追加:タスク、接続、変換にそれぞれコメントを追加できるようになった。これにより、各種設定内容の組織内での共有を支援
- データソースの追加:SAP Ariba Procurement、SAP Ariba Sourceを追加
- レプリケーション先の追加:CouchBaseを追加
また、ドライバーに対して以下のような変更を行ったという。
- Veeva Vault CRM:接続をサポート
- Excel:指定したファイルパスの配下にあるファイルへアクセスが可能に
- Docusign:新たにビュー/カラムを追加(BillingInvoices、BillingPayments、BillingPlans、CloudStorage views)
- ServiceNow:カラム名をAPI名からGUI名にスイッチできるプロパティを追加
- YouTube アナリティクス:Audience retention report view(視聴維持率)を追加
- SharePoint:新しいビュー「items」を追加
- Bing Ads:新たにテーブルをサポート対象に(DataExclusion、SeasonalityAdjustment)
- Amazon Athena:ストリーミングエンドポイントのサポートにより、パフォーマンスを4〜9倍向上
今後は、IBM DB2でのCDC(変更データキャプチャ)対応や、リバースETLの書き戻し先へのkintoneの追加などの機能アップデートを予定しているとのことだ。