コピーデータが増加し、かかるコストは2018年には5兆円に
データのバックアップに関して、飯野氏は「2018年コピーデータ問題」を挙げた。本番で使うデータをマスタデータとすると、その複製がコピーデータ。IDCの調査によると、コピーデータは年々増加し2018年にはデータ保護にかかるコストは5兆円になると予測されている。
コピーデータは保護目的のスナップショット、レプリケーション、バックアップだけではなく、テストや開発用、さらに近年では統計や分析用にデータウェアハウスへコピーされるデータもある。同調査によると82%の企業が1個のマスタに対して10個以上のコピーを持つという。
マスタデータに対してコピーデータはサービスレベルが異なるため、かかるコストは単純にコピーした分の倍数にはならないものの、マスタデータの6割ほどにも上ると言われている。さらにマスタデータは年率4割で増加するという調査結果もある。年率4割で増加するマスタデータに、そのコストの6割をコピーデータに費やすから、コストはどんどん膨れ上がる。2018年には5兆円に到達するというわけだ。
加えて飯野氏は「統制面での問題」を指摘する。アプリケーションやインフラの複雑化と、コピーデータの増加により企業内のデータは統制が取れなくなりがちだ。そこでは様々な問題が発生しうる。例えば「システムの重要度に合わせたSLA(サービス品質)になっていない」、「バックアップのスループットがでないときのボトルネックがどこにあるか分からない」、「必要なデータを入手するのにシステム的、組織的な手続きが複雑で時間がかかる」などだ。
「こんな事例がありました」と飯野氏は言う。ある企業は定期的にバックアップを実施していたものの、ジョブが正常終了したかどうかしか確認していなかった。そのためバックアップに欠損があったことに気づかず、リストアしたら欠損していた分がマスタデータから失われてしまったという。バックアップにはこんな落とし穴もある。
こうした背景をうけ、EMC World 2016でEMCはコピーデータ問題を解決するためのデータ管理ソリューションを提言した。ポイントとしては2つ。まず1つはインフラ効率の最適化。コピーデータを適切な数にすること、適切な場所に配置することだ。もう1つはオペレーションの適正化。コピーデータ全体を見渡せるように透過的なビューを提供することと、使い慣れた標準ツールで操作ができるようにネイティブの技術を使うこと。これら2つを実施することで「企業における適切なサービスレベルを達成できます」と飯野氏は言う。
具体的な製品となるのが「Enterprise Copy Data Management(以下、eCDM)」。飯野氏は「コピーデータは全体で管理するように発想を変えましょう」と提言する。主要な機能は「発見」、「自動化」、「最適化」、「再利用」の4つ。
発見
どこにどのコピーデータがあるかマッピングして全体を把握できるようにする。例えばVMAXの中にスナップショットがいくつあり、ほかのサーバーにいくつ分散させているかを図で表示する。
自動化
サービスレベルに応じて制御方法を定義し、実施を自動化する。例えば災害対策のためのコピーデータは厳重に保護する、あまり重要度が高くないものは筐体内でのスナップショットにするなどポリシーを定義する。以降はポリシーに準じた運用を自動化し、効率を高める。
最適化
データ保護レイヤを俯瞰的に表示することでコピーをどう管理すれば効率的か気づきやすくする。俯瞰できると非効率なものや不必要なものを排除するなど最適化につなげることができる。
再利用
全体を俯瞰することで、例えば開発用のコピーデータを分析用にまわすなど、再利用できるものを見いだすことができる。
なおeCDMはRESTのAPIでも使えるため、これまで使用していた管理ツールとの統合も可能だ。