「データの民主化」を加速する、データプロダクトと品質管理
AI時代におけるデータは、企業にとっての「宝」だ。しかし、ローデータ(生データ)はゴミが混ざった状態の「宝箱」のようなものであり、これを前処理して磨き上げられた「品質の良い宝」にする必要がある。
Dell AI Data Platformでは、AIと“データの民主化”を推進するためにデータを「製品」として扱い、各ドメイン(事業部門)が管理・公開する“データプロダクト”と位置付けられている。このデータプロダクトとは、技術的およびビジネス的なメタデータ(概要、スキーマ、利用方法、プライバシー情報など)が付与されたデータセットであり、目的のデータを見つけるための「宝の地図」を提供する役割を担う。
このときデータの品質は、ローデータ(ブロンズ層)から中間データ(シルバー層)を経て高品質なデータ(ゴールド層)へと段階的に磨き上げる。そして、ストレージエンジンには「Dell PowerScale」と「ObjectScale」を採用。Dell PowerScaleは、GPUサーバーの大量I/Oに耐える高スループットアーキテクチャと動的なスケールアウト能力を持つ。加えて、メタデータをデータエンジンへと自動的にエクスポートできるため、非構造化データを素早くAI-Readyなデータセットとして用意可能だ。
また、データは常にサイバー攻撃の標的となる。特に非構造化データは、企業の知的財産や機密情報を含んでいるため価値が高く、企業全体のデータの90%を占めるために管理が難しい。特にアクセス権限を突破されてしまえば、盗難や窃取のリスクは格段に高まる。
そこでDell AI Data Platformは、サイバーレジリエンス機能を搭載。「統合RBAC(ロールベースアクセス制御)」によるアクセスコントロール、行レベルのフィルタリング列レベルのマスキングなど、細かなデータ制御も可能だ。
さらに特権アカウントの無効化、多要素認証、イミュータブルスナップショットといった機能強化も施されており、オプション機能の「Cybersecurity Suite」では不審な動きをリアルタイムで監視・検知し、自動スナップショットや自動ロックアウトを実施。エアギャップ環境によるバックアップデータの隔離、迅速な復旧も実現できる。
加えてPowerStoreは、厳しい基準を設けている米国連邦政府の承認済み製品リストに登録されており、バックアップエージェントをストレージ内部に搭載。専用機器に直接データを転送する「Storage Direct Protection」を統合している。
[画像クリックで拡大]
他にも容量・性能などの逸脱を検知する異常検出機能に加え、7,000種以上のランサムウェア亜種でのトレーニング、99.99%の信頼度で破損を検出できる「Index Engines CyberSense」を活用したランサムウェア検出・フォレンジック分析機能を搭載。これらのセキュリティ機能により、ミッションクリティカルなワークロードの安全なバックアップデータを特定でき、ローカル環境での高速なリカバリーを実現している。
この記事は参考になりましたか?
- Data Tech 2025 レポート連載記事一覧
-
- AI活用の成否は「データ品質」で決まる 成果を生むためのインフラ戦略
- ビジネスメタデータ整備は「大きな戦略、小さな実行」で “AIレディ”な環境実現に向けた具体...
- 「決断力の変革」こそがデータ活用の真価──カギとなる“産業”を知り尽くした自律型デジタルワ...
- この記事の著者
-
EnterpriseZine編集部(エンタープライズジン ヘンシュウブ)
「EnterpriseZine」(エンタープライズジン)は、翔泳社が運営する企業のIT活用とビジネス成長を支援するITリーダー向け専門メディアです。データテクノロジー/情報セキュリティの最新動向を中心に、企業ITに関する多様な情報をお届けしています。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
提供:デル・テクノロジーズ株式会社
【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社
この記事は参考になりましたか?
この記事をシェア
