情シスが「データ提供屋」を卒業する“使える基盤構築”の要諦 勘に頼らないメタデータ更新の仕組みづくり
第3回:価値が不明なデータを「宝の山」に変えるアプローチ
3. IT部門は「データ抽出屋」を卒業? メタデータ管理のポイント
IT部門が業務部門の要望を受け、必要なデータを抽出して提供するという光景は従来よく見られましたが、データカタログはこのような業務フローを一変させます。データカタログを見てどこにどのようなデータが存在しているか確認し、業務部門自身でデータにアクセスできる仕組みを検討できるからです。
ここで重要なことは、このデータカタログを常に新鮮な状態に保つこと、またその活動を継続させることです。古いデータカタログでは最新のデータ定義に基づいた適切なデータ利用が阻まれると同時に、新たに追加された非構造化データの存在にも気が付かず、活用することができません。データカタログを自動でアップデートする仕組みの構築や、カタログに記載する情報が適切かどうかをチェックしつつ維持・管理していく活動が、これからのIT部門に求められてくるでしょう。
次章では構築されたデータカタログを維持していくためのルール整備とガバナンスの構築について説明します。
4. データカタログを維持するルール整備とガバナンス
データカタログの価値は“最新で使える”ことにあり、更新が途切れた途端に意味を成さないものになってしまいます。データカタログを維持・運用するにあたっては、定義情報を適切に記載し、更新していくことが求められます。ではどうすべきか。具体的な手法として、カタログの記載内容・レベルを一定の品質に保てるよう、これをルール化して運用することが有効です。
データカタログを長く役立つ状態で保つためには、まず更新作業をできる限り自動化することが重要。手作業での更新は、例外的な対応や緊急時に限るのが基本方針です。
また、カタログの設定や説明などのメタデータは、決まった書式の設計ファイルとして管理しておきましょう。変更するときは、事前に第三者のレビューと自動チェック(テスト)を通すことで、誤りや抜け漏れを減らします。これは「Everything as Code(あらゆる設定をコードのように扱う)」という考え方で、ソフトウェアの変更管理と同じやり方を取り入れています。
各データセットは「製品」として扱い、何に使うのか(用途)、どれくらいの頻度で更新されるのか(SLA=更新の約束)、どの程度の品質を満たすのかをあらかじめ決めて明示しておきます。こうすることで、利用者は安心してメタデータを利用でき、運用側も期待値を管理できます。
アクセス権限は「タグ」と呼ばれるラベルで一元管理します。たとえば「機密度」や「担当部門」などのタグを作成し、そのタグに応じて「見られる人・見られない人」のルールを自動で適用するといった方法が有効です。万が一に備え、データの公開状況のデフォルトは「非公開」とし、業務に必要な人にだけ最小限の権限を付与することで、情報漏えいのリスクを低減できます。
さらに、変更内容は「いつ・誰が・何を・なぜ」変えたのかが後から分かるように記録し、監査ログとして保管することが欠かせません。これにより、問題が起きたときに原因をたどりやすくなり、説明責任も果たせます。
最後に、運用の良し悪しは“感覚”ではなく“数値”で評価することが重要です。メタデータの更新が約束どおりの頻度で行われているか、データが実際に使われているか、エラーや違反がどれだけ発生しているか、といった指標を数値で定期的に確認しましょう。その結果をもとに、運用ルールや仕組みを見直し、継続的に改善していくことが重要です。
まとめ
本稿では、非構造化データを統合して活用するアプローチを解説しました。データの利用目的を明確にして必要データを特定し、データの所在・定義・品質・系譜を可視化した上で、メタデータ中心のレイクハウスにデータを統合していくことで、非構造化を最大限に活用するための土台を整えられます。
また、データ利用を促進するための重要なカギとなるデータカタログにも触れました。データカタログはメタデータの管理基盤であり、利用者のデータ発見性を高め、ガバナンスやコンプライアンス、セルフサービス分析を支援するものです。このデータカタログを“最新で使える”状態に維持するためには、人手に頼らないルール整備とガバナンスが重要となります。
次回は本連載の最終回として、これまでの連載で解説してきた具体的な手法を継続していくための組織体制方法を解説します。データガバナンス実現のための専用組織の立ち上げと定着化、ガバナンスと体制の整え方などに触れ、これからのIT部門に求められる役割についても展望を述べたいと思います。
この記事は参考になりましたか?
- 理想論で終わらせない「AIのためのデータ整備メソッド」連載記事一覧
-
- 情シスが「データ提供屋」を卒業する“使える基盤構築”の要諦 勘に頼らないメタデータ更新の仕...
- “場当たり的ETL連携”で絡まったデータ基盤を阻止せよ──「疎結合なAPI戦略」に導く実践...
- Excelでの管理、レガシーシステムによる分断……AIの前に考えるべきデータの問題と「4つ...
- この記事の著者
-
角 邦彦(カド クニヒコ)
合同会社デロイト トーマツのシニアマネジャー。システムインテグレータ、日系コンサルティング会社を経て現職。システム構築の上流工程と事業開発案件を多数経験。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア
