Sybase IQはHANAのニアラインストアという位置づけ
「リアルタイム・データ・プラットフォーム(RTDP)」―これがSAPのデータマネージメント基盤だ。アプリケーションの下支えをするデータ活用の基盤はどうあるべきか、そのコンセプトがRTDPなのだ。昨年くらいまで、SAPは、インメモリデータベースのSAP HANAを全面的に押し出してきた。まさに「データベースはすべてHANAでOK」という勢いのメッセージだった。
しかしながら、「HANAは中核ではありますが、RTDPの中の1つの製品です」と、SAPジャパン ビジネスソリューション統括本部 データベースソリューション部長の安藤秀樹氏は言う。
RTDPには、トランザクション・データベースのSAP Sybase ASE、分析データベースのSAP Sybase IQ、モバイル、埋め込み型のSAP Sybase SQL Anyware、そしてイベントプロセッシング技術でストリームデータ処理を行うSybase ESPといったものがあり、さらにリアルタイム処理に特化したSAP HANAが中核に位置する。これらすべてを、有機的に結合してRTDPは構成されるものであり、今後この「RTDP」はSAPのソリューションを説明する際にたびたび登場することになるとのこと。
RTDPの中で、ペタバイトクラスを超える大規模エンタープライズ・データウェアハウスを実現するのが、SAP Sybase IQだ。そのメジャーバージョンアップが、今回発表となった。ERPなどの基幹系システムのリアルタイム分析ならば、HANAがそれを担うというのがSAPの戦略。Sybase IQは、「HANAのニアラインストア」と位置づけられ、ペタバイトを超えるような膨大なデータを「蓄積」し、それを瞬時に分析する目的で利用する。そして、この仕組みをアプライアンスではなく、さまざまなプラットフォームで稼動するオープンなソフトウェアで提供しているのも、Sybase IQの特長だと安藤氏は説明する。
パフォーマンス向上のためにストレージアーキテクチャを変更
前バージョンとなるSybase IQ 15は、2009年に提供を開始した。その後はマイナーバージョンアップを続け、直前のバージョン15.4の日本語対応版は、2012年5月に提供されている。そこから1年あまりで、今回大幅に拡張された16へとメジャーバージョンアップを果たしていることからも、SAPが買収後もSybase IQへの継続的な投資を行なっていることが分かる。今回の16では、さまざまな機能拡張によりVLDB(Very Large Database)を超える「XLDBに対応します」と、ソリューション本部 テクノロジーエンジニアリング部 シニアディレクターの原 利明氏は言う。
XLDBの分析に対応するため、ストレージアーキテクチャの見直し、システム信頼性向上のための新たな取り組み、ローディング・エンジンの改良、クエリ・プロセッシングのさらなる効率化といった拡張がバージョン16ではなされている。ストレージアーキテクチャについては、内部構造を変更し固定長で格納していたページを可変長にする大きな変更がなされた。これにより無駄なストレージ領域の確保が必要なくなり、圧縮効率も向上、結果的にはディスクIOも削減され性能の向上につながっている。
また、標準で利用されるFPインデックスにおいては、従来は1、2、3Byte単位でインデックスが構成されていたが、これがN-bit対応となりメモリ量、ディスクの削減を実現している。これは、以前はたとえばカラムデータが男/女など値が2種類しかない場合にも1Byte、つまり8bitの領域が必要だった。N-bit化したことで、この場合には2bitだけでFPインデックスを構成できるのだ。
さらに、大規模データウェアハウスのシステムでボトルネックになりやすいローディング・エンジンも大きく改良されている。その1つが、差分更新などを行う際、差分を既存データのB-treeインデックスにロード時点でマージするのではなく、いったん差分だけの小型のインデックスをメモリ上に展開するようにしたロードの内部構造の変更だ。メモリ上の差分のインデックスは、定期的にバックグラウンドで既存のインデックスとマージする。マージされる前に行われる検索は、メモリ上のインデックスと既存インデックスの両方を用い処理される。これにより、データロードによるタイムラグを最小限にできるのだ。また、バルクロードの際には、「すべての処理がパラレル処理になりました」と原氏。並列化したことでCPUコアの処理能力が効率化し、これによってもロードのパフォーマンスが向上している。