AIに浮足立つ今こそ考えたいデータマネジメントの意義──“当たり前にデータを使える状態”を整えるには
エージェント時代に求められる「データ品質」「メタデータ」「ガバナンス」の勘所
エージェンティックAI時代に問われる「メタデータ」と「データガバナンス」の在り方
2つ目の要素となるメタデータに関して、primeNumberでは「テーブルやカラムの説明から、データの来歴を管理するデータリネージまで」をメタデータと捉えている。データリネージを可視化していれば、特定のテーブルで問題が起きた際にも、修正の影響範囲を明確化できる。また個人情報漏えいのインシデントが起きた際にも即時に対応可能な体制を整えられる。
「ビジネスメタデータの文脈では、社内特有の表現を整理した上で用語集を整備することも有効だ」と山本氏は説明する。たとえば「グロス売上(全体の売上額)とネット売上(グロス売上から諸費用を引いた実質的な売上額)をそれぞれ計算する場合、どのように算出するか」といった事前情報がなければ、AIに計算式ごと渡して指示しなくてはならない。その必要がないようにビジネスメタデータをAIに付与しておくこともメタデータ管理に該当する。
また、組織がメタデータをどれだけ整備できているかによって、今後のAIプロジェクトのスコープが大きく変わると山本氏は語る。多種多様なデータを集めようとするほどコストがかかる。一度も参照される機会のないデータを「とりあえず」で集めても、使わなければ無駄なコストが増えるだけだ。そこで「キリがないから」と諦めるのではなく、プロジェクトの目標を明確にすることで必要なデータがおのずと見えてくる。目標から逆算して徐々に広げていく方法が効率的だ。
3つ目の要素となる「ガバナンス」は、データマネジメント活動を全社的視点からルールベースで統制する活動を指す。データ品質を保ち、セキュリティを高める上でも重要な要素だ。
ガバナンスが適切に効いていないと、権限をもたないユーザーがAIエージェント経由で機密性の高い人事データにアクセスできてしまうといったことが起こりうる。だからといって社内データへのアクセスを禁じてしまうと、個人でChatGPTを利用する状況とさほど変わらず、大きなビジネス成果は期待できない。セキュリティインシデントを未然に防ぎ、経営層が求めるビジネス成果を得るためには、適切な制御が求められるのだ。
山本氏は「権限設定以外の他にも様々な制御の工夫が考えられる」と話す。たとえば、PoCと本番稼働でデータの扱いを変える場合、PoCではメールアドレスにマスクをかけ、本番稼働後のキャンペーンではマスクを外して使うといった手法だ。ユーザーがデータを安心して使えるよう、仕組みの裏側を支えるのがデータガバナンスといえる。
「作って終わり」のデータ基盤がAI活用の妨げに……
AIが実力を発揮するための土台として、データ基盤は重要な役割を担うものだが、データ基盤を構築して終わりにしてはいないだろうか。「ここにすべてのデータがあるので自由に使ってください」と提供するだけでは、ユーザーはどのデータをどう使えばいいかがわからない。基盤ありきでユーザーを置き去りにしていると、AI活用をスケールさせるに至らないのだ。
また、IT部門と事業側が別々に基盤を構築している場合、部分最適となり活用の目的を全社で共有できない。ユースケースと全社基盤を一体的に捉え、プロジェクトを前に進めることが重要となる。
このような日本企業の現状を踏まえ、primeNumberが全社を挙げて取り組んでいるテーマが「AI-Readyなデータ基盤の構築と運用のサポート」だ。「人間の問いに対して、AIが苦労せず迅速に必要なデータにアクセスし、回答を作成して出力できる状態を作ること。そして、この状態を維持できることが、AIを活用する企業に実現してほしい理想だ」と山本氏は話す。
まず、TOROCCOが担うデータ収集や統合で注力している点が、可能な限りAIの近くにデータを持ってくることだ。データがAIの近くにあれば、処理が速くなる。AIに何かを依頼したときに目的のデータが近くにあれば、別の場所に格納されているデータにAPI連携でアクセスする必要がないからだ。
今後、データ収集の処理はAIでより簡素化されることになるだろう。そうなると、データ基盤の運用がより重要になってくる。そこで同社は、オブザーバビリティの向上に焦点を当て、TOROCCOにおけるデータの品質チェック機能の提供準備を進めているという。
データエンジニアにとって、常に品質の高いデータをユーザーに供給することは、一筋縄ではいかない骨の折れる業務だ。ましてや専門のデータエンジニアがいない企業はその難易度はさらに上がる。そこで、こうした業務を補完する自動化機能を提供しているのがTOROCCOだ。山本氏は「お客様のデータ基盤の裏側で、常に必要なデータが“ステータスOK”な状態で流れ続けている環境を作りたい。データ活用の“手前部分”を私たちに任せてもらえれば」と述べる。
もう1つの主力製品「COMETA」が担うのは活用領域だ。これは、AIによるメタデータ探索機能のリリースを機に、データ活用のためのデータカタログ製品として提供してきたものを刷新したもの。TOROCCOと合わせてデータパイプラインの入口から出口までを一気通貫でサポートできるようにする狙いがある。「“データ整備”と“データから価値を引き出すこと”の距離を縮めることが目標。この距離をゼロにするまで取り組んでいきたい」と山本氏は語った。
この記事は参考になりましたか?
- 冨永裕子の「エンタープライズIT」アナリシス連載記事一覧
-
- AIに浮足立つ今こそ考えたいデータマネジメントの意義──“当たり前にデータを使える状態”を...
- AIエージェントの「全社展開」はなぜ失敗するのか セールスフォースが示す、成功に向けた“4...
- オンプレからのクラウド移行をAIエージェントが実現、AIはDB移行の塩漬け問題を解決する一...
- この記事の著者
-
冨永 裕子(トミナガ ユウコ)
IT調査会社(ITR、IDC Japan)で、エンタープライズIT分野におけるソフトウエアの調査プロジェクトを担当する。その傍らITコンサルタントとして、ユーザー企業を対象としたITマネジメント領域を中心としたコンサルティングプロジェクトを経験。現在はフリーランスのITアナリスト兼ITコンサルタン...
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア
