データのバックアップとリカバリのための先進的なソフトウェア製品で知られるアクロニスでは、毎年「アクロニス世界障害復旧評価指標」と呼ばれるレポートを発表している。最新のレポートでは、2011年9月~10月に世界18カ国の従業員1,000人以下の企業、約6,000人のIT管理者を対象にアンケート調査を行い、その結果をさまざまな角度から分析するとともに、各国別のランキングや傾向の違いも掲載されている。「企業の情報資産」は毎年肥大化、複雑化しているが、その管理は適切にされているのか?このレポートでは、各企業のバックアップやリカバリに関する意識とその実施状況をまとめている(*)。
同レポートによると、日本は調査対象国の中で、障害復旧に対する意識、信頼度が3番目に高いという結果が出ている。これは、2011年3月に発生した東日本大震災の対応で培った自信や意識の高さを反映していると思われるが、その一方で日本企業から寄せられた回答だけを集計した結果を見ると、まだまだ多くの点で課題が残っていることも浮き彫りになっている。
企業システムのバックアップや障害対策を考える上で、非常に示唆に富む情報が多く掲載されている同レポートだが、今回その内容について、S&Jコンサルティング 代表取締役 三輪信雄氏と、アクロニス・ジャパン セールスエンジニアリングディレクタ 吉田幸春氏、アクロニス・ジャパンのマーケティングディレクタ 今村康弘氏の3人が、さまざまな角度から読み解きながら、対談形式で闊達に語り合った。
ちなみに三輪氏は、2007年まで大手セキュリティベンダーであるラックの代表を務め、現在は自らが設立したS&Jコンサルティングを率いて、セキュリティコンサルティング業務を手掛けている。そんな同氏からは、セキュリティの専門家ならではの独自の視点から、斬新な意見や提言が相次いだ。以降で、この対談の内容をかいつまんで紹介する。
<注>なお、本稿の()中のページ指定は、「アクロニス世界障害復旧指標」の該当ページを指している。ぜひ、下記よりダウンロードの上、ご参照いただきたい。
(*)「アクロニス世界障害復旧評価指標:2012」のダウンロードはこちら
仮想サーバの乱立は「引越しでゴミを捨てない」のと同じ?
三輪 まずこのレポートを見て意外に思ったのが、32%の企業が本番サーバの半数以上をサーバ仮想化環境で稼働させているという結果です(p.10、11)。従業員数1,000人以下の中堅・中小企業にしては、非常に高い数字だなと感じました。この結果を見て、「今後は仮想サーバがデファクトスタンダードになっていくのだろうなあ」と思いました。
吉田 サーバ仮想化は、サーバ環境を少量の物理サーバ上に集約することで、複数のサーバ環境をまとめて冗長化できるメリットがあります。物理サーバ環境を1台1台冗長化構成にするより、コスト面で効率的なんです。中堅・中小企業にとっても、これは大きなメリットの1つと言えます。
三輪 ただ、仮想サーバ環境が増えれば増えるほど、仮想サーバのバックアップに必要なディスク容量が肥大化し、バックアップにかかる時間も相当なものになりますよね。それに、1台の物理サーバ上に多数のサーバ環境が載っているということは、物理環境が死んでしまったら、その上に載っているサーバはすべてもろとも死んでしまうわけですよね。また障害に限らず、メンテナンスのために物理サーバを停める場合も同様に、すべての仮想サーバが停まってしまいます。
今村 もちろんシステムダウンのリスク低減には物理ホストを冗長構成にすることが重要です。1台の物理ホストが停止しても別の物理ホスト上で仮想マシンを継続稼働させる仕組みですね。ですが、冗長構成に加えて、仮想化環境では物理環境のとき以上に、バックアップに気を遣う必要があります。ただご指摘の通り、複数の仮想サーバ環境を丸ごとバックアップするとなるとデータ量が大きくなって、それ相応の設備への投資が必要になりますから、中堅・中小企業ではまだ十分な対応ができていないのが実情です。
三輪 このレポートでも、仮想マシン上のデータの保護はまだ不十分だという結果が出ていますね(p.12、21)。約4分の1の企業が、物理マシンほどの頻度ではバックアップをとっていないとあります。
吉田 その理由の1つとして、サーバ仮想化のスナップショット技術がバックアップの代わりになると思い込んでいる人が多いことが挙げられます。当たり前のことですが、スナップショットとバックアップはまったく異なるもので、スナップショットはバックアップの代替えではありません。
三輪 これは私の勝手な思い込みなんですが、サーバ仮想化にすぐ走りたがる人は「ルーズな人」だと思っています(笑)。引越しのときに、ゴミを捨てずにそのまま新居に持っていくタイプですね。サーバ環境について真剣にケアするのが面倒くさいから、「取りあえず仮想化しとくか」という人が、バックアップについてもベンダーから「冗長化してるから大丈夫ですよ」と言われたのを鵜呑みにして、「じゃあ、バックアップしなくてもいいんだ!」となっているのではないでしょうか? 勝手な推測ですが(笑)。
吉田 でも確かに、仮想サーバはハードウェアを購入する予算や稟議もいらないわけですから、物理サーバに比べてはるかに手軽に構築できてしまいます。ですから、安易にサーバを構築する機会が増えているのも確かだと思います。また、誰が構築したか分からないような物理サーバや、今後いるのかいらないのかわからない物理サーバもあるかと思います。マシンのリースアップ時や撤去時に、「とりあえず仮想化して置いておこう」ということもありますね。
今村 それに今では、J-SOX法をはじめとするコンプライアンス対応のために、不要になったデータであっても一定期間は保管しておかなくてはいけませんからね。本当は不要になったデータやサーバ環境はどんどん捨てていった方が、ITのフレキシビリティは向上するはずだと思うんですが。
三輪 そこでよく言われるのが、「情報資産の優先順位をきちんと付けてバックアップ戦略を練りましょう」ということなんですが、私はこれはナンセンスだと思っています。物理サーバ環境ならいざ知らず、仮想サーバ環境はホストに障害が発生すればみんな一緒に障害を受けることになるわけですから、すべての仮想サーバのバックアップは、必ずとっておく必要があります。情報資産の重要性が仮に低いサーバであっても障害があれば結局は復旧させるので、そのコストはかかることになります。それに、たとえ優先順位が低くても、無くなって構わないサーバや情報なんて本当はないはずです。それだけ、企業が保有する情報資産は価値が高いということなのです。しかし、それが適切な形では必ずしも守られていない、という現状があります。
今村 そうですね。企業がサーバ仮想化を導入する目的の1つに、古いOSのサーバ環境を延命させることがあります。これも、たとえ古い環境であっても捨てられないから、わざわざ仮想化しているんですよね。特に中堅・中小企業では、こうしたケースが多く見られます。
世界と比べた場合の日本のバックアップ/障害復旧事情
三輪 このレポートの後半では、日本のアンケート結果がまとめられていますが、個々の数字をよくよく見てみると、非常に興味深い考察が得られそうです。例えば、「バックアップと障害復旧運用の予算が前年比で1%減少している」とありますが(p.19)、その一方で「バックアップと障害復旧の包括的な運用を実現できるテクノロジー/リソースが十分にある」という質問に「YES」と答えた回答者は、2010年から2011年にかけて増えています(p.18)。1%の減少という数字は誤差の範囲内かもしれませんが、これは一見すると矛盾する結果にも見えますね。
今村 震災の影響を考えても、予算額は増える方が一見自然に見えますよね。ただ恐らくこれは、対策を検討してはいるものの、まだ2011年度中の予算に計上されるまでには至らなかったケースが多かったのだろうと推測しています。
吉田 レポートにも「オフサイトへのバックアップ戦略が整備されていない」とありますが(p.14)、実際のところ震災直後はオフサイトへのバックアップを検討する企業が非常に多かったものの、ではそれを実行に移した企業がどれだけあったかというと、ほとんどなかったというのが実情です。ある程度大掛かりなソリューションになりますから、コスト面のハードルが高くて、結局着手にまでは至らなかったんですね。その代わりに、2011年末辺りからは、クラウドを使った代替ソリューションがベンダーやSIerから提案されるようになりました。
三輪 なるほど。ちなみにほかに興味深かったのが、ワールドワイドでの一年当たりのダウンタイムの平均が2.2日なのに対して、日本では2.8日と長くなっています(p.19)。これはなぜだとお考えですか? 日本人がシステムダウンに対して寛容だということではないですよね(笑)。
吉田 私自身の経験を踏まえて考えてみますと、日本人は海外の人に比べて、非常に慎重に当たります。障害の内容や原因、影響範囲や対応に掛かる時間やダウンタイムの予測やロールバック計画等を、事前に細かく定めてドキュメント化します。障害時はそれに従って行動するのですが、作業承認や作業確認等を全て含めるとどうしてもトータルの作業時間が長くなるのかと思います。これに対して海外では、割と「まずはやってみるか!」というノリで対応することも多いようです。
三輪 つまり、技術的な仕組みが整っている・いない以前に、判断に至るまでの人的プロセスに時間をかけるということですね。
今村 そうですね。ちなみにワールドワイドではシステムダウンの原因の1位に「人為的ミス」が挙げられていますが(p.15)、日本ではそれが2位になっているのも(p.19)、慎重に慎重を重ねた承認プロセスを通すがために日本では人為的ミスが少ないことを表しているのかもしれません。
三輪 日本人はいい意味で慎重、悪い意味で判断が遅いと言えるかもしれません。ただ、ではいざダウンタイムを短くしようと考えたとき、現実問題としては判断のプロセスを削るわけにはいきませんよね。となると、ほかに打てる施策にはどのようなものが考えられますか?
吉田 やはり、復旧作業自体にかかる時間を短縮するしかないでしょう。その場合、アクロニスが提供しているようなイメージバックアップのソリューションは、システムやデータのバックアップを別々にとって、それらを別々にリストアしていく方法と比べ、復旧にかかる時間、つまりRTOを大幅に短くできる利点があるのです。