基幹系で大事なのは一にもニにも可用性!
とここで、再び石川さん登場。
情報系データベースに求められる
要件の違いについて熱く語る石川さん
「基幹系データベースで一番大事なのは、とにかく可用性!ミッションクリティカルな基幹系システムを支えるデータベースですから、何があっても動き続けなくてはいけません。一方、情報系データベースの方は、大容量データの保管・検索の用途向けに最適化した代償として、可用性は多少落ちても構いません」
この違いは、確かにイメージしやすい。基幹系システムが丸一日落っこちたら誰かの首が飛びそうだけど、データウェアハウスへのアクセスが数時間間止まったぐらいなら、「ごめんね、てへっ(ハートマーク)」ぐらいで何とか済むかもしれない。
逆に、情報系データベースで大事なのは、何でもかんでもぶちこんだ大容量データの中から、いかに早くお目当てのデータを引っ張ってこれるかというところ。お目当てのデータがデータベースの中にあることが分かっているのに、検索のクエリを投げていつまで待っても結果が返ってこないようでは、せっかく溜め込んだデータも宝の持ち腐れだ。「検索が遅い?あと半日待ってね、てへっ」では、たとえハートマークを2つ並べたとしても多分許されないだろう。
というわけで、そろそろ基幹系データベースと情報系データベースに求められる要件の違いが見えてきた。
基幹系データベース
・決まった形のデータしか受け付けませんわよ
・余分なデータなんて、とっておいてどうするの
・その代わり、何があっても絶対に止めないから、見ててごらんなさい!
情報系データベース
・たまに落っこちても許してね、てへっ
・その代わり、どんなデータでもどんどん入れちゃってね
・自由検索の速さなら、誰にも負けないんだから!
うん、こうやってキャラを書き分けると、違いが分かりやすいかも。で、日立のデータベース製品で言うと、前者のクールなお姉さんキャラがHiRDB、後者のドジッ娘キャラがHADBというわけだ。どちらに萌えるかは、読者しだい。ちなみに筆者は、どちらかといえばドジッ娘派だ。
それはさておき、まあ、HiRDBが基幹系データベースに求められる要件を満たしているというのは、これまでの実績を見ても明らかだろう。何せ、「信頼の日立」をまさに体現するような製品で、これまで超ミッションクリティカルな分野でずっと使われ続けてきたデータベースなのだから。ただ逆に、HiRDBは基幹系向けに特化しているが故に、情報系データベースで求められる「大容量データに対する高速検索」はあまり得意ではないということだ。
そこでHADBの出番というわけだが、ここで疑問が1つ沸く。じゃあ、情報系データベースの方も、HiRDBを流用しちゃえばよかったのでは? そうすれば、新しくデータベースエンジンを開発しなくても済むし、第一ほかのデータウェアハウス製品って、大体そんな感じで作られてるような。既存のデータベース製品を使って、たくさんのデータベースを並べて、分散処理させて、でもって専用のハードウェアでアプライアンス化して、みたいな。同じように、HiRDBをいっぱい並べれば一丁上がりなんじゃないの?
なぜ日立はそうではなく、あえてHADBという、情報系の用途に特化したまったく新しいデータベースエンジンを一から開発したのだろうか。とここで、山口さんの目がキラリと光る……。