要件に応じてクラウドとオンプレミスを適切に使い分けることが重要
─パブリッククラウド、特にIaaS は、少し前まではIT系の新興企業が主なユーザーでした。しかし最近では、IT業界以外の一般企業による利用も少しずつ増えてきています。
そうですね。我々がこれまで提供してきた専用サーバーのサービスも、始めはIT系新興企業が使っていたのですが、技術が成熟するにつれSIerが自社サービスの基盤として使い始めて、それが一般企業にも波及していきました。現在、これとまさに同じような流れが、Amazon Web Services(AWS)などのパブリッククラウドでも見られます。さくらのクラウドも、数年後には一般企業にも使っていただけるよう、品質や運用面でのブラッシュアップを進めていきたいと考えています。
ただユーザーにとっては、システムがクラウド上で動いているかどうかはあまり重要ではありません。実際、クラウドサービスよりもハードウェアを丸ごと借りる物理サーバーサービスの方が有利な場面もあります。例えば、クラウドでは仮想化技術を使って複数のサーバー環境を1つのハードウェア上に集約しますから、ハードウェア障害の影響が広範に及ぶリスクがあります。また性能面でも、複数の仮想サーバーを使った分散処理よりも、高性能なハードウェアを占有して処理を行った方が効率的な場合もあります。弊社でも、こうしたニーズに適した新しい専用サーバーサービスの提供を3月中に開始する予定です。要は、クラウドと物理サーバーの両者を、用途やサービスレベルの要件に応じてうまく使い分けることが重要だと思います。
─ 耐障害性や安定性は、やはりパブリッククラウドにとって今後の課題の1つと言えるのでしょうか。
実際のところ、新たにパブリッククラウド市場に参入するベンダーの多くが、何らかの障害を起こしているのが実情です。ただ、今後IaaSの分野に関しては、大手サービスの収斂が進むと考えています。その過程では、耐障害性や安定性に関するノウハウをより多く蓄積した大手ベンダーが何社か生き残ることになるでしょう。従って、競争と淘汰の過程で、相対的にサービス品質は上がってくると思います。
もう1つ言えるのは、「クラウド環境は、物理環境に比べて安全だ」という業界側のミスリードがあったために、ユーザーに誤解を与えている面があるということです。確かにクラウドでは、障害時の復旧作業はデータセンター側で自動的に行われますが、ハードウェアが故障すればサーバーが落ちてしまうのは物理環境とまったく同じです。システムの可用性を高めるためには、本来は物理環境と同レベルの冗長化を施さなくてはいけません。例えばAWS であれば、異なるリージョンに渡ってシステムを分散しておけば、1つのリージョンの障害ですべてのシステムがダウンしてしまうことはありません。このような運用の必要性を強調してこなかったことが、結果としてユーザーをミスリードしてしまったのではないかと考えます。
─ さくらのクラウドでも、サービス開始直後にストレージ周りの障害が発生しましたが、原因はどこにあったのでしょうか。
一言で言えば、共有ストレージのパフォーマンスチューニングの問題でした。クラウドサービス用には非常に高性能なストレージ装置を用意しているのですが、クラウド環境では大量の仮想マシンから、それぞれ異なる性質のストレージアクセスが発生します。従って、一般的なストレージの用途とはかなり異なる傾向のアクセスが発生します。しかもいざサービスを開始してみると、予想をはるかに上回る量のアクセスが発生しました。その結果、我々もストレージベンダーもテスト時には予想できなかった量と質のストレージアクセスが発生し、ただでさえ難しい共有ストレージのパフォーマンスチューニングがうまくいかなかったわけです。
もちろん、現在ではこれらの問題は解決して、サービスを安定的に提供できています。ただし、根本原因とその対策をきちんと論理立てて説明するためのレポートをユーザーに公開する必要がありますから、現在それをまとめる作業を進めているところです*。
* 編集部注:2012年2月9日取材時現在