EnterpriseZine Press（AD）

データ活用の裏に見えるIT部門の疲弊……“誰でもすぐに”を叶えるデータ収集環境の構築術とは

データ収集の属人化を解消！データパイプラインツールで実現する効率的なデータ活用基盤

2024/07/08 10:00

通知

多様なデータソースから“信頼できるデータ”を集める

　CData Syncでは、それぞれのデータソースへの接続情報を明確に記録する。これにより、どのデータソースからどのようなデータを取得したのかを明確に把握できる。データの変換処理をGUIで定義し、その内容を記録。データがどのように変換されたのかも追跡できるため、分析結果の信頼性も向上されるという。

　またジョブの実行履歴を記録し、いつ、どのデータが抽出・変換・ロードされたのか、エラーが発生した場合はその内容も記録する。これらの情報は、データの整合性や処理の信頼性を証明する上で極めて重要だ。その上でユーザーの操作履歴を監査ログとして記録し、誰が、いつ、どのような操作を行ったのかを追跡することも可能。これらの機能により、収集したデータや分析の結果に対する説明責任を果たせる。

　多くの企業が、人手に頼ってデータを集めている。それでもなんとかデータ活用はできるかもしれない。しかし、「今後活用規模を拡張して全社でデータを活用したい」「生成AIなど新しい技術でも、社内のデータを使いたい」。こうした要望への対応を、属人化したまま進めるのは限界がある。求められるのは、安定して信頼性のあるデータを、人手をかけずに収集できること。集めたデータに対し透明性を確保し、説明責任を果たせるようにすること。「それを解決できるのが管理されたデータパイプラインであり、CData Syncです」と疋田氏は言う。

　IT部門が忙しすぎて疲弊している。欲しいデータを手に入れるのに1ヵ月以上かかる。経営層に分析結果について質問されても、自信をもって説明できない。そのような課題を抱えているなら、ぜひ一度、ツールによるデータパイプライン構築、管理を検討してほしい。その際には、世界で最も信頼されたコネクタを要するCData Syncを候補にしてほしいと疋田氏は強調する。

この記事は参考になりましたか？

印刷用を表示

関連リンク: 「CData Sync」の導入事例
EnterpriseZine Press連載記事一覧: 坂出市の自治体DX、ホームページを「窓口」に全面刷新──電子申請は最短2クリックで来庁者4...

LINEヤフーが数万規模のAI活用を支える基盤構築、柔軟性と堅牢性を兼ね備えた設計思想と構...

Databricksが示した、AIエージェント統制の鍵　CDPで業務アプリケーションにも進...

もっと読む

この記事の著者: 谷川耕一（タニカワ　コウイチ）

EnterpriseZine/DB Online チーフキュレーターかつてAI、エキスパートシステムが流行っていたころに、開発エンジニアとしてIT業界に。その後UNIXの専門雑誌の編集者を経て、外資系ソフトウェアベンダーの製品マーケティング、広告、広報などの業務を経験。現在はフリーランスのITジャーナリスト...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事