集中か? 分散か? NTTドコモがDWH/データレイクから「データメッシュ」に移行したワケ
「Snowflake World Tour Tokyo 2025」レポート
生成AI活用で「データカタログ」のメタデータ整備を効率化
NTTドコモでは、ユーザーが必要とする“データの発見”を促すため、データカタログの整備も強化した。最後に登壇した同社 上野正暉氏は、中央集権型のデータカタログの問題を「中央のチームがすべてのデータを把握できず、適切なメタデータの整備が難しい」と指摘し、データオーナーやユーザーがデータカタログの更新に関与できるように変えたとした。

これには中央のチームメンバーの負荷を減らす狙いがあるが、データ知識が豊富だからといって、現場の負荷を増やすことになっては意味がない。また、データメッシュのような分散型のアーキテクチャでは、中央集権型よりも共通ルールを徹底させることが難しくなる。そこでデータオーナーにすべての更新権限を与えるのではなく、特定部分の更新のみ認めることで、データガバナンスの自律性とデータカタログの品質維持の両立を図ることにした。
たとえばデータカタログの更新時、データオーナーはメタデータを追加しなくてはならなくなったが、手作業で行う必要はない。ツールが効率的な作業をサポートしてくれる。このツールの裏側で活躍するのが「生成AI」だ。LLMがうまく機能するよう、NTTドコモは事前にデータオーナーが遵守するべきルールを定めたデータ規約を整備。LLMがデータ規約を含めた社内文書を参照できれば、データオーナーがルールを意識しすぎることなく、メタデータの効率的な整備が可能になると考えた。
データオーナーが使うツールは、Streamlit in Snowflakeで開発したアプリケーションだ。データカタログの更新は、データオーナーのクリックひとつでできる。その処理は、テキストデータの検索を得意とするCortex Searchが行い、ドキュメントとデータを参照し、データカタログに付加すべきメタデータ情報を出力してくれる。データオーナーは、その結果を確認・修正して整えるだけでよい。ユーザーも同じアプリケーションを使うが、データカタログから選んだデータの説明がわかりにくい場合は、フィードバックを提供できる。次の更新で、Cortex Searchはその内容も参照して、新しい出力結果を提供するので、ユーザーの評価を取り入れた継続的な改善が可能になった。

[画像クリックで拡大]
この他、Cortex Analystを用いて業務に特化した「SQL生成」も行っていると、上野氏は紹介した。データメッシュへの移行、生成AIの活用と、NTTドコモでのデータ活用の裾野は着実に拡がっている。今後はAI自体が自律的にデータを取得し、アクションまで実行するユースケースが増えてくるだろう。そのときデータ基盤の重要性はますます高まる。最後に再び登壇した松原氏は、今後データ基盤を継続的に強化することを表明して、講演を締めくくった。
この記事は参考になりましたか?
- 冨永裕子の「エンタープライズIT」アナリシス連載記事一覧
-
- 大阪ガスが「Energy Brain」で実現したエネルギーマネジメントの自動化とAIエージ...
- 集中か? 分散か? NTTドコモがDWH/データレイクから「データメッシュ」に移行したワケ
- なぜ企業の生成AI活用は思うように進まないのか? 「期待とのギャップ」を埋める対策──Ga...
- この記事の著者
-
冨永 裕子(トミナガ ユウコ)
IT調査会社(ITR、IDC Japan)で、エンタープライズIT分野におけるソフトウエアの調査プロジェクトを担当する。その傍らITコンサルタントとして、ユーザー企業を対象としたITマネジメント領域を中心としたコンサルティングプロジェクトを経験。現在はフリーランスのITアナリスト兼ITコンサルタン...
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア