Title:REDEFINE Oracle Infrastructure with Flash & Dell EMC-フラッシュとDell EMCでOracle インフラストラクチャを新たに定義
Speaker:Dell EMCのBart Sjerps(Principal Systems Engineer)
データベースサーバーにこそオールフラッシュ
IOUG(Independent Oracle User Group)の調査によると、DBAの時間を消費するタスクとして「データベースのパフォーマンス問題の診断」や「バックアップ、リカバリ、レプリケーション、フェールオーバーの監督」が上位に並んだ。ムーアの法則の通りにコンピュータの性能は伸びているにもかかわらず、データベース環境が複雑化しているため性能監視と対応に手間がかかっているためだ。またデータベースシステムは年々ビジネスで重要性を高めているため保守も怠ることができない。
Dell EMCはOracle Databaseのためのソリューションを1995年から提供してきている。信頼性や拡張性に優れたインフラストラクチャの構築、予測可能な高パフォーマンスを実現、可用性を高めるなど、多くのソリューションを持つ。Oracle Databaseに詳しいスペシャリストも多い。
Dell EMCのPrincipal Systems Engineer、Bart Sjerps氏もそのうちの一人。同氏は「データベースにおいてI/O待ちが発生するべきではない」と指摘する。大量のデータ処理を行う場合、I/O待ちはボトルネックになりがちだ。これはストレージの問題なので「フラッシュストレージが解決します」とSjerps氏は断言する。
ここでハードディスクドライブ(HDD)とフラッシュを比較してみよう。HDDは1956年に登場。約60年の歴史があり、広く普及している。シーケンシャルなアクセスには向いているものの、機械的な理由でレイテンシーがある。一方、2008年に登場したばかりのフラッシュは(HDDのように回転する構造ではないため)機械的なレイテンシーはなく、ランダムなアクセスにも強い。
ランダムリードが発生する処理だと、データベースサーバーの9割もの時間がI/O待ちになり、CPUはほとんど稼働していないことがある。これをオールフラッシュに変えるとI/O待ちが激減し、CPUの使用率が倍増する。レイテンシーは全体で70%強ほど短縮できる。HDDからオールフラッシュに変えることのインパクトは大きい。
さらにDell EMCのXtremIOであれば、インラインデータ重複排除やインラインデータ圧縮があるため平均で1/6のデータ削減が可能となる。常にシンプロビジョニングが有効であり、フラッシュに適したデータ保護機能などがある。Sjerps氏は性能を高めるには「古い慣行は忘れ、やりかたを変えていかなくてはなりません」と話す。
これまでの慣行とは例えばディスクの過小割り当て(ショートストローキング)やストライピング、全てをプリロードすること(Sjerps氏は「モンスターキャッシュ」と呼ぶ)などが挙げられる。これらは機械的な制限があるHDDを想定したものだ。さらにさかのぼれば旧来型のRAIDやストレージの階層化などもある。性能と経済性がトレードオフになるものもあったが、オールフラッシュなら「ベストなパフォーマンスと経済性が得られます」とSjerps氏は言う。
実際にフラッシュに移行した時にどれだけ効果が得られるかは、移行前のHDDにどのようにデータが入っているかにもよる。そこでSjerps氏は分析ツール「QDDA:Quick and Dirty Dedupe Analyzer」を自ら開発し、GitHubなどでオープンソースとして提供している。ディスク、ファイル、データストリームの重複したブロックをスキャンするLinuxツールだ。これで分析すると、XtremIOならどの程度のストレージ容量が必要になるかが分かり、効率化の予想が立てられる。
QDDA:Quick and Dirty Dedupe Analyzer
さらなるイノベーションとしてSjerps氏はNVMeを挙げた。SSD向けに開発されたプロトコルで、SSDの特徴を生かして性能を高めることができる。徐々に新製品に搭載されてきている。