情シスが「データ提供屋」を卒業する“使える基盤構築”の要諦 勘に頼らないメタデータ更新の仕組みづくり
第3回:価値が不明なデータを「宝の山」に変えるアプローチ
本連載「理想論で終わらせない『AIのためのデータ整備メソッド』」では、「データの把握」「データの整備」「データの活用」の3フェーズに分けて、AI時代のデータ利活用に向けた実践的なアプローチを解説しています。第3回となる今回は、企業が保有するデータの約9割以上を占めるといわれる「非構造化データ」の整備方法にフォーカス。データを「ただ溜めているだけ」で終わらせないための統合ステップと、非構造化データ活用に欠かせないデータカタログの効率的な整備方法などについて解説していきます。
非構造化データをレイクハウスで統合するアプローチ
連載第1回では、データ活用の出発点である「課題の把握」に焦点を当て、日本企業でデータ利活用を阻む4つの壁を整理しました。そして第2回では、これらの壁のうち特に「データの分散・サイロ化」と「業務プロセスの壁」を主因とする断絶を乗り越え、部門ごとに分断されたデータを全社横断で分析・活用できる「信頼性の高い資産」へ転換する道筋を3つの柱をもとに解説しました。これらの内容を踏まえ、本稿ではデータのなかでも「非構造化データ」に焦点を当て、第2回で解説した構造化データ(業務データ)と統合して活用するための仕組みを考察します。
▼第1回の記事
▼第2回の記事
SNSの投稿、IoTセンサーデータ、画像や音声など、企業に蓄積される非構造化データは昨今爆発的に増えています。しかし、こうしたデータが何に役立つのか分からないまま蓄積され続け、管理コストだけが膨らむというケースは少なくありません。そこで今回は、分散・サイロ化に悩むビッグデータを「宝の山」に変えるための具体的な方法を解説していきます。まずは非構造化データをレイクハウスで統合するアプローチについて説明し、非構造化データを活用する上でカギとなる「データカタログの重要性」について述べていきたいと思います。
前回(連載第2回)はAPIを軸としたデータ統合基盤を構築し、サイロ化された業務データを統合する方法を解説しました。今回は非構造化データをレイクハウスで統合し、ビジネス価値創出へ直結させる実装論に踏み込んでいきます。
この記事は参考になりましたか?
- 理想論で終わらせない「AIのためのデータ整備メソッド」連載記事一覧
-
- 情シスが「データ提供屋」を卒業する“使える基盤構築”の要諦 勘に頼らないメタデータ更新の仕...
- “場当たり的ETL連携”で絡まったデータ基盤を阻止せよ──「疎結合なAPI戦略」に導く実践...
- Excelでの管理、レガシーシステムによる分断……AIの前に考えるべきデータの問題と「4つ...
- この記事の著者
-
角 邦彦(カド クニヒコ)
合同会社デロイト トーマツのシニアマネジャー。システムインテグレータ、日系コンサルティング会社を経て現職。システム構築の上流工程と事業開発案件を多数経験。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア
