SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

  • Security Online
  • DB Online
  • 財務・会計Online
  • ニュース
  • 新着記事一覧
  • イベント

    IT Women Summit
    2026年5月26日(火)オンライン開催

    EnterpriseZine Day 2026 Summer
    2026年6月9日(火)オンライン開催予定

    • 酒井真弓の『Enterprise IT Women』訪問記

      酒井真弓の『Enterprise IT Women』訪問記

    • IT部門から“組織変革”を~気鋭のトップランナーを訪ねる~

      IT部門から“組織変革”を~気鋭のトップランナーを訪ねる~

    • 2025年のトップランナー35人が見据える今と未来 年末特別インタビュー presented by EnterpriseZine

      2025年のトップランナー35人が見据える今と未来 年末特別インタビュー presented by EnterpriseZine

    • 待ったなし!「新リース会計基準」対応への一手

      待ったなし!「新リース会計基準」対応への一手

    • Next エンタープライズAI

      Next エンタープライズAI

    • コミュニティ型勉強会「情シス塾」

      コミュニティ型勉強会「情シス塾」

  • ブログ

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

最新イベントはこちら!

IT Women Summit

2026年5月26日(火)オンライン開催

EnterpriseZine Day 2026 Summer

2026年6月9日(火)オンライン開催予定

IT Strategy Summit 2026

2026年7月16日(木)東京・JPタワーホール&カンファレンスで開催予定

EnterpriseZine(エンタープライズジン)

EnterpriseZine編集部が最旬ITトピックの深層に迫る。ここでしか読めない、エンタープライズITの最新トピックをお届けします。

『EnterpriseZine Press』

2026年冬号(EnterpriseZine Press 2026 Winter)特集「AI時代こそ『攻めの経理・攻めのCFO』に転じる」

理想論で終わらせない「AIのためのデータ整備メソッド」

情シスが「データ提供屋」を卒業する“使える基盤構築”の要諦 勘に頼らないメタデータ更新の仕組みづくり

第3回:価値が不明なデータを「宝の山」に変えるアプローチ

1. “データのゴミ貯め”にしない、非構造化データ整備の3ステップ

 非構造化データの整備は以下3つのステップで実行します。

ステップ1:目的の明確化

 まずは非構造化データを活用する目的を明確にすることから始めます。たとえば「生産設備に設置したIoTデバイスで収集したセンサーデータを、BIで分析し異常の抽出や変化の兆しを捉えたい」「SNSデータを生成AIに学習させ、数字の文脈や背景を整理したい」など、非構造化データの活用方法を具体化します。活用方法が明確になることで「何のデータがどの形式で必要なのか」が具体化されます。

ステップ2:データの可視化と抽出

 次に、必要な非構造化データがどこに存在しているかを探索し、それを利用できる形式に抽出します。ステップ1で触れた例を用いると、IoTデバイスで収集したデータはデータレイクに保管されているでしょうし、SNSデータはクラウド上で公開されているデータとも考えられます。

 データの所在はどこであっても構いません。これまで企業におけるデータ活用の文脈では、社内に保管・蓄積したデータを活用していくことにフォーカスされてきましたが、今はデータがどこに存在しているのかさえ明確になっていれば、その情報を正しく認識することでデータへアクセスできます。

 まとめると、データ資産の所在・定義・品質・系譜を整理し、レイクハウス構築のために対象データを抽出するという作業が2つ目のステップです。

ステップ3:レイクハウスの構築

 ステップ2で抽出したデータを用いてレイクハウスを構築します。レイクハウスにはすべてのデータを保管するのではなくメタデータを保管し、それを参照することで実データへアクセスできる環境を整えることが肝です。レイクハウスを構築する段階で実データの型変換などを行わないようにすることで、さまざまな非構造化データの活用ハードルを下げられるからです。

 また、必要に応じて動画・静止画・ドキュメントなどの非構造化データを要約した情報も半構造化データとして取り込むことで、利便性を高めます。これらの要約情報は、AIを活用することで効率的に作成可能です。利用者は、特徴データを用いた検索(例:交通事故が発生したデータの抽出)に活用できます。

 ステップ2で整理したデータ資産の所在・定義・品質・系譜は、メタデータとしてレイクハウス上で管理されます。さらに、メタデータには非構造化データ自体へのアクセス方法・取得方法も定義することで、ステップ1で検討したBIや生成AIでデータを活用できます。ステップ2で抽出したデータは、サンプルデータとしてレイクハウスへ保管します。

クリックすると拡大します

 非構造化データを整備するにあたり、注意すべきポイントがいくつかあります。まず、レイクハウスを構築してデータをそこに蓄積し、いつでも使える状態にするというアプローチは避けてください。こうしたアプローチはデータの利用目的があいまいなため、結果的に使われないシステムを構築してしまう典型例となってしまいます。本章で示したように、最初に目的を明確にして、データの所在を明らかにした上でデータを抽出し、レイクハウスを構築するという手順で進めることが、非構造化データを最大限に活用するための最短ルートなのです。

2. 非構造化データを定義する「データカタログ」の役割

 前章でレイクハウスを構築し、非構造化データを統合するアプローチを解説しました。とはいえ、そもそも「必要とするデータが社内にありそうではあるが、どこにあるかわからない」「それを確認する相手や手段もわからない」という課題は往々にして見られます。

 この問題を解消し、データ利用を推進して行くうえで鍵となるのが「データカタログ」。データカタログはデータ資産の所在・定義・品質・系譜を一元管理し、検索・アクセス制御を容易にするメタデータ管理基盤です。利用したいデータへのアクセス性を高め、ガバナンスやコンプライアンス、セルフサービス分析を支援します。

 かつて業務システムに閉じた範囲でデータ活用を考えていた時代には、明確なデータ定義があるため、そのままデータウェアハウスを構築してBIツールで分析を行うのが一般的でした。しかし、複数のシステムをまたいだ広範なデータ分析の重要性が高まってくると、システムによってデータ定義にギャップが生じてしまう問題が生じました。この対処方法として、マスターデータ管理の仕組みを活用してデータ定義を行うことで、システムをまたいだデータ分析を可能にしたのです。

 しかし、この方法は構造化データを前提としたアプローチで、非構造化データを扱おうとすると同様の定義は現実的に困難でした。そこで、この壁を乗り越える仕組みがデータカタログです。

 データカタログを言い換えるとすると、社内で保管している、あるいは社内で利用可能なデータの情報を管理するツールといえましょう。データカタログを参照することで、自社で利用可能なデータに関する情報を一元的に把握することができます。

クリックすると拡大します

次のページ
3. IT部門は「データ抽出屋」を卒業? メタデータ管理のポイント

この記事は参考になりましたか?


広告を読み込めませんでした

広告を読み込み中...

  • Facebook
  • X
  • note
理想論で終わらせない「AIのためのデータ整備メソッド」連載記事一覧

もっと読む

この記事の著者

角 邦彦(カド クニヒコ)

合同会社デロイト トーマツのシニアマネジャー。システムインテグレータ、日系コンサルティング会社を経て現職。システム構築の上流工程と事業開発案件を多数経験。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/24170 2026/04/24 08:00

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング