Sybase IQの有用性
最後に、弊社製品を簡単に紹介させていただこうと思います。
サイベースには、2つの主要な製品があります。1つは「ASE(Adaptive Server Enterprise)」、もう1つは「Sybase IQ」です。
どちらもSQLを解釈・実行するRDBMSですが、何が違うかと言いますと、前者は基幹系業務システム用、後者は情報系システム用に設計されている点が異なります。
基幹系業務システムと情報系システムでは、RDBMSに対して求める性能が異なります。
基幹系業務システムは、発生した事実を出来るだけ早く正しく登録すること、つまり大量に発生する更新作業をどれだけ高速に処理できるかが問われるのに対し、情報系システムは、大量なデータから必要なデータをどれだけ素早く見つけ出せるか、あるいは集計できるかが問われます。これらの要求は排他的であり、同一のRDBMSで実現しようとすると必ずトレードオフが発生します。たとえば更新処理に対してはI/Oサイズは小さい方がよいけれども、検索処理を考えるとI/Oサイズは大きいほうがよい、どちらを製品仕様にするべきか? という具合です(ご参考までに、ASEのページI/Oのデフォルトサイズは2KB。これに対してIQのそれは128KBです)。
このように基幹系業務システムと情報系システムとでは、元々RDBMSに求める性能が異なるので、弊社では性能要件に適合する製品をそれぞれ用意しているのです。
集計に必要となるデータだけを取得し高速検索
さて、ここで紹介させていただきたいのは、言うまでも無く「Sybase IQ」です。
最初に紹介すべきIQの特徴は、カラム単位のデータ格納です。通常の基幹系業務システム用のRDBは、テーブルのデータをロー単位にディスクに格納するのに対し、IQはカラム単位に格納しています。人は誰でも大量なデータを目の前に出されたら、集計によって傾向や問題点を把握することから分析を開始すると思いますが、このとき集計されるのは特定のカラムであってロー全体ではありません。つまりIQは、集計に必要となるデータを必要最低限のI/Oで取得できる仕組みになっているのです。
以前、何度かプリセールス活動の機会があり、ユーザのデータを使用したデモンストレーションを実演したことがありますが、「本当に集計しているのか?」と問われたほど、IQの検索性能は優れています。データウェアハウス用のエンジンに求められる最も重要な性能は、大量データをいかに高速に検索・集計できるかであり、IQはその特殊な設計によりこの要求に応えています。
このほか、IQの特徴を列挙させていただくと、
- スキーマ非依存。セントラルウェアハウス、データマートいずれにも有効。
- データを圧縮格納。生データを約7割程度に圧縮。
- 高度なロード性能。
- OLAP関数をサポート。単一クエリでキューブデータを取得可能。
- 拡張性。負荷分散のため複数マシンをクラスタ化する構成が可能。
- メンテナンスの容易性。統計情報の更新、デフラグなどのメンテナンスは不要。
などが挙げられます。
データウェアハウスの構築ポイントとして、「データウェアハウスの特性に適合するよう設計されたデータベース製品を選定すること」という項目を最後に追加させていただきたいと思います。