どのようなシステムでも記憶媒体となるストレージは不可欠である。それはファイルサーバーやデータベースサーバーの記憶領域だったり、ログデータやバックアップの保存場所であったり。データは定型から非定型まで、今はマシンデータや動画も多い。企業が管理しなくてはいけないデータは年々増え続けている。
ストレージの管理は意外と「重労働」だと小林氏は指摘する。計画や設計から始まり、ハードウェアの調達で長い待ち時間があり、実際に導入した後は保守や拡張も行わなくてはならない。この一連の流れはおおよそ3~5年のサイクルで繰り返されるという。これにかかる労力は意外とばかにならない。
また「クライダーの法則」もある。ハードディスクの単位面積あたりの記憶容量は2年で倍増するという経験則だ。ストレージはディスクを追加すればどんどん保存できるものの、データ量が増えるとそれをリプレースで移動するのも大がかりとなる。
しかし昨今ではAWSほかクラウドストレージが普及してきた。自社ストレージではなく、ネットワークを介してクラウドにデータを格納できる。利点はキャパシティに制限がなく(使った分だけ利用料を払えばいい)、製品ライフサイクルに応じてリプレイスする必要もない。こうしたインフラ整備や保守はクラウドサービス側に一任できて、預ける側はほかの重要な業務に専念できる。
ストレージサービスはクラウドサービスの中でも最初の一歩にはいい。データの格納先だけ、あるいはバックアップの格納先として使うなら技術的にも心理的にも敷居が低く、ストレージサービスからクラウドを利用するユーザーは多いはずだ。
もう慣れ親しんだストレージサービスかもしれないが、あらためてAWSにどのようなストレージ関連のサービスがあり、どのように活用できるかをおさらいしよう。AWSで提供される主要なストレージ関連サービスは以下の通り。
Amazon S3(Simple Storage Service)
AWSのストレージサービスの基本となるもの。容量無制限(1ファイル5TBまで)、高い堅牢性、利用料は月額で1GBあたり約3.3円で、秒間110万アクセスが可能。
Amazon Glacier
S3に比べて安価である代わりに取り出しに時間がかかる。出し入れする頻度が少ないバックアップ専用に向いている。容量無制限(1ファイル40TBまで)、高い堅牢性、利用料は月額で1GBあたり約1円。
Amazon EBS(Elastic Block Store)
EC2(仮想サーバー)に接続できる仮想ディスクボリュームサービス。1ボリュームは1TBまで。ディスクイメージをS3に保管するスナップショットが可能。磁気ディスクあるいはSSDが選べる。
AWS Storage Gateway
オンプレミス環境からクラウドストレージへ接続するためのサービス。オンプレミスとクラウドで連携してバックアップする環境に向いている。使い方は主に3通り。プライマリデータをAmazon S3に保管し、頻繁にアクセスするデータをローカルに保持する「ゲートウェイキャッシュ型ボリューム」。プライマリデータをローカルに保管し、そのデータのスナップショットを非同期にAmazon S3にバックアップする「ゲートウェイ保管型ボリューム」。クラウド上の仮想テープに格納する「ゲートウェイ仮想テープライブラリ」。
Amazon Zocalo(限定プレビュー)
クラウドストレージにデータを保存するだけではなく、ActiveDirectoryと連携できる文書保管・共有サービス。一般ユーザーが使えるようにインターフェースが提供されているのが特徴。社内のファイルサーバーとして使える。パソコンだけではなく、スマートフォンやタブレットからも使える。ファイルにコメントを付与したり、バージョン管理ができるなどちょっとしたグループウェア的に使える。現時点では限定プレビューで利用可能。
AWSにおけるストレージサービスはS3を中心にいろんなサービスと連携することができるようになっている。いくつかの活用基本パターンを紹介しよう。
ファイルサーバーのストレージとして
AWSのEC2をファイルサーバーとして用いて、ストレージにEBSを使う。スナップショットはS3に保存する。中小規模のクラウドファイルサーバーとしてこのパターンが多い。あるいはファイルサーバーをオンプレミスで稼働させ、AWS Storage Gatewayを通じてデータをAWS上のS3に格納することもできる。ゲートウェイにはAWS Storage GatewayのほかにriverbedのSteelStoreといったアプライアンス製品もある。
バックアップのストレージとして
ファイルサーバーと重複するがオンプレミスあるいはクラウドで使うデータのバックアップとしてS3を使う。特定のタイミングでスナップショットをとることもできる。オンプレミスのストレージの中にはS3にバックアップ可能なアプライアンスNAS(バッファロー、I-O DATA、QNAP)やバックアップ製品(ARC Serve、シマンテックなど)がある。もしバックアップ先としてS3に対応していなければAWS Strage Gatewayや先述したゲートウェイ製品を用いればいい。
クラウド上のバックアップは使用頻度が少なければGlacierに移してコストを抑えるのもいいだろう。一定期間を過ぎたものはS3からGlacierに自動的に移動させるようにライフサイクルポリシーを設定することもできる。
データHUBのストレージとして
ビッグデータやデータ分析のストレージとして使う。主にS3にデータを格納し、データの分析や整形にAmazon Elastic MapReduceを用いたり、Redshiftで分析する。RedshiftとはEC2上に各種BIツールをインストールして使うケースも多い。
データはオンプレミスやAWSにあるEC2やKinesisなどのシステムから収集し、まずはS3に格納することになるのだが、必要に応じてAmazon RDSやAmazon DynamoDBなどに転送して使うこともある。AWS Data Pipelineを使えば指定された間隔でデータを移動できる。
コンテンツ配信のストレージとして
コンテンツ配信サーバーとしてAmazon Cloud Front、そのストレージにS3を使うイメージだ。動画を変換するならAmazon Elastic Transcoderがある。現時点ではベータ版。
AWSなら単にデータを格納するだけではなく、ほかのAWSサービスと連携すると相乗効果も得られる。AWSはサービスの豊富さもまた特徴でまさに「至れり尽くせり」。最適な組み合わせを選べば高い効果が得られそうだ。