一歩進んだストレージ管理自動化
「一歩進んだ」とは具体的にどういうことだろか。一言で言えば、それは、“how to do” の自動化から“what to do” の自動化への進化と言えるだろう。例えば、バックアップに関連する複雑な作業を自動化してくれるのが“how to do”の自動化だ。もちろん重要な機能だがこれだけでは十分ではない。“what to do” の自動化とはそもそもどのデータをいつどこにバックアップすべきかをシステムが判断してくれる自動化、つまり、そもそも何をやるべきかを自動化してくれるということだ。別の言い方をすれば、業務要件から得られたポリシーに基づいた管理をシステムが提供していけるということだ(図3)。
このような一歩進んだストレージ管理自動化として、近年、特に注目を集めている機能に、自動ストレージ・ティアリング(AST)(自動階層化)がある。頻繁にアクセスされるデータ(ホット・データ)を高速だが高価なストレージに置き、あまりアクセスされないデータ(コールド・データ)を安価だが低速なストレージに置くという作業をシステムが自動的に行なってくれるというソリューションだ。
ASTと同様の考え方は、ILM(情報ライフサイクル管理)やHSM(階層型ストレージ管理)などの名称で古くから存在したが、ILMやHSMがファイル単位での管理を行なうのに対して、ASTはブロック単位での管理を行なう点に相違がある。1つのファイル(例えば、データベースのスペースやExchangeのメールボックス)の中でも、その中にはホット・データとコールド・データが混在していることが通常であることから、効率性とコストを最適化するためにはASTは有利である。なお、テープなどの機器も含めた全体的なストレージ階層管理においては依然としてILM/HSMは重要だ。
今日、ASTが注目を集める最大の理由は、フラッシュ・メモリー・ベースのSSD(半導体ドライブ)の普及である。SSDはアクセスタイム、ランダム・アクセス時のスループット、電力消費量などの点で、ハードディスク・ドライブ(HDD)と比較した圧倒的優位性を有する。コスト低下と信頼性の向上により、SSDは一般企業のIT予算においても十分に現実的な選択肢となっているが、容量あたりの価格という点ではHDDとSSDの間には1桁以上の差がある。この差は今後とも縮まることはないだろう。SSDの価格低下は進んでいくが、HDDの価格低下も同等以上のペースで進んでいくからだ。
その一方で、SSDの性能向上ペースはHDDよりも速い。SSDが半導体技術と同等のペースで高速化していくのに対し、HDDは機械的部品の制約を受けるからだ(例えば、HD のスピンドル回転数が今後継続的に増加していくことは考えにくい)。つまり、SSD の適切な活用が今後のIT 基盤においてますます重要になることは確実だ。
SSDの採用は、従来のストレージ階層にもう一段階レベルを加えることになる(図4)。さらに、図には示していないが、ストレージ階層にはメディアの特性だけではなく、コントローラーの性能、ソフトウェア機能、RAIDの保護レベル、さらには、同一ディスク上における外周と内周(外周の方が一回転で読めるセクター数が多くなるためスループットが大きい)などの多様な選択肢がある。これらの多様な選択肢を考慮して、データの配置を手作業で決定することはきわめて困難だ。ASTソリューションによる“what to do”の自動化がまさに必要とされている。
なお、SSDを有効活用するストレージ階層管理の自動化という点ではDBMSレベルの機能を採用するという選択肢もある。しかし、「ビッグデータ」の世界ではデータの大部分はデータベースではなくフラットファイル上に存在することになるため、ストレージレベルでの自動階層管理は必須と言えよう。