2.データ容量削減
データ容量削減は、ストレージの保管コストや消費電力を抑えられるだけでなく、災害対策システムへのデータ転送量削減によって通信コストを下げることもできる。IBMでは「データ圧縮」と「重複削減」の2 つのテクノロジーを提供している。
まず既存のNAS環境に大きな変更を加えずにデータ圧縮を実装できる製品としてReal-time Compression Appliances(RtCA)がある。RtCAをNASデバイスとクライアントの間のネットワークに配置することで、クライアントから書き込まれるデータをリアルタイムに圧縮し、NASデバイスへの書き込みの速度を保持しつつ、最大80%もの容量を削減して保管する。読み込みもリアルタイムに実施されるため、パフォーマンスを低下させることなく物理的なディスク容量・筐体数を削減することができる。
次に、仮想テープライブラリーであるProtecTIERは重複削減技術を提供している。重複削減はストレージの技術として以前から利用されているが、その多くはHash方式を利用しており、その特性により重複削減されたデータが低い確率ながらも失われる可能性を否定できずにいた。しかしProtecTIERは特許であるHyperFactorテクノロジーを採用することにより、データロストの危険性を0%にしながら最大25分の1 まで重複削減することに成功した特筆すべき製品である。
更に、Hash方式では一度蓄積したデータに対してバッチ処理的に重複削減プロセスを走らせるケースが多く、この処理のための時間枠を別途設ける必要があったり、ストレージ容量を余分に確保する必要があった。ProtecTIERのHyperFactorテクノロジーは、重複削減によるパフォーマンスへのオーバーヘッドがなく、書き込み時にリアルタイムで重複削減を実施することが可能であり、Hash方式の課題点を解決した上で、最大2000MB/secという高いスループットで大容量データの高速なバックアップが可能である。
併せて、ProtecTIERは筐体間での遠隔コピー機能を備えており、重複削減された後のデータを筐体間でコピーすることによって、回線を流れるデータ量を削減しつつ災害対策システムを構築することが可能である。
3.利用効率の向上
業務ごとに分離したシステムではそれぞれ利用されているストレージの容量を融通することができず、投資のタイミングも異なるため容量不足に悩む管理者は多い。しかしIBMの調査ではこうしたバラバラのディスク容量の総和に対して、利用しているデータの総和を見ると、使用率が50%を下回る顧客が大半であることが判明している(図2)。
これは、ストレージ統合によって容量に余裕があるシステムの領域を、容量が逼迫しているシステムに融通することが非常に効果的であることを示している。併せて、近年では一般的となってきたシン・プロビジョニングといった仮想化技術を併用することで、サーバーからは透過的にストレージの利用率を向上し、実際の使用量を管理することで計画的にシステム全体として必要な時期に容量追加の投資をすることが可能となる。
まとめ
ビッグデータ時代の到来に向けて、データ容量の増大、アクセス数の増大、サービス・レベルへの要求の高まりがますます加速することが見込まれる。こうした動きに対応するには、本稿で紹介したような最新テクノロジーを駆使した効率的なストレージ基盤が必要となる。
IBMでは、ストレージやサーバー、ネットワークなど、ITインフラ全体の最適化により無駄な投資や運用コストを削減し、その原資をビッグデータ活用のための戦略的投資に振り向けるアプローチを推奨している。