インデックスの貼れない非定型検索にはBLUアクセラレーションが良い
株式会社 三菱東京UFJ銀行 システム部 上席調査役の井澤淳一氏は「ハードウェアについては、必ず障害が起こるものだという前提となっています」と語る。金融機関という厳しいシステム要求の中で、ハードウェア障害が発生しても運用が続けられる仕組み、それを構築しているということだ。
Big Data Technology Forumのセッションでは、そんなシステムの一部について井澤氏が紹介。それが、経営情報システムの「ZEUS」だ。これはいわゆるデータウェアハウスのシステムで、セントラルウェアハウスと各種データマートで構成される。2007年に運用が開始され、セントラルウェアハウスはメインフレームのDB2を用いている。各種マートはオープンプラットフォームで、DB2のバージョンは8.2、9.7とさまざまなものが使われている。データマートのDB2のアーキテクチャは、シェアードナッシング型でパーティショニングを利用、速度性能を重視した構成と言える。
「データウェアハウス向けに最適化していますが、課題も出てきています。たとえば定型的なレポートが2倍に、アドホックな検索も8倍に増えてきたのです」(井澤氏)
当初の利用は定型的なレポーティングが中心だった。これであれば、適切なインデックスを貼るなどでチューニングができる。利用していくにつれ要求は拡大、アドホックな検索処理が大きく増え、このままでは十分なレスポンスが提供できない。「ハードウェアの増強などで性能を維持してきましたが、抜本的な改善が必要だと考えました」と井澤氏。
非定型検索を速くする方法としては、Netezza(PureData System for Analytics)のような専用アプライアンスを導入するという方法がある。あるいは、solidDBなどのインメモリデータベースを採用する手もあるだろう。さらにはDB2 10.5に新たに搭載されたBLUアクセラレーションを利用することも考えた。
インメモリについては、まだまだメモリーのコストが高いという懸念があった。BLUについては、専用の列指向データベースを別途用意する必要がない点が評価された。「あとはIBMが8から25倍は速くなると言うが、本当なのか。それを実機で検証することにしました」と井澤氏。ZEUSで稼動中のSQL、テーブルを利用し、およそ300万件のデータに対しBLUアクセラレーションの性能検証が行われた。
行った検証は、主に行指向データベースでは苦手な処理が中心だった。結果は「BLUは圧倒的に速かった。ものによっては200倍、平均しても10から20倍は速くなりました」とのこと。BLUアクセラレーションは、データマートの非定型検索、とくにインデックスを付けられないようなところで効果が高そうとの結果となった。これはベータ版での検証であり、列指向のデータベースには大きく期待ができそうだと井澤氏は言う。今後は、BLUのもう1つの謳い文句である運用が楽だという点も検証していく予定だ。