ビッグデータの活用ではカラムナー型アーキテクチャが最適
このビッグデータの課題を解決するために生まれたのが、Verticaだ。データベースの世界的な権威であるマイケル・ストーンブレイカー氏が、開発に携わったことでも有名な新しいデータベース製品。旧来のOLTP系データベースと異なり、最近流行のカラムナー型のアーキテクチャを持ち、大量データの分析に特化している。「カラムナー型として世界で最初の製品ではないが、かなり初期から開発されているものです」と、すでにこの領域に置いて技術の蓄積があることをセランド氏は説明する。
このVertica、ポイントとなるのは高速な分析処理性能、高い拡張性、そしてオープンなアーキテクチャと最適化されたストレージの4つ。高速な分析性能については、「あまりにも処理が速いため、顧客からは本当に分析を行っているのかどうかが分からないと、疑われることもあります」とセランド氏。増え続けるデータにも、「事実上、無限に拡張できます」とのことだ。
ストレージの最適化は、アーキテクチャがカラムナー型であることから生まれる効率のいい圧縮機能によるもの。旧来のデータベースに比べ10から30倍のデータを格納できる。この圧縮率の高さは、ストレージを節約するだけでなく、IOを減らして性能の向上にも貢献する。この圧縮の効果は、MicrosoftやOracleなども同様に主張しているところ。
Verticaはビッグデータ分析に特化しているとはいえ、ビッグデータでやりたいことすべてをVerticaだけでできるわけではない。適宜、BI/BAツールやETLツールなどと連携する必要がある。そのために、オープンなアーキテクチャを持っているというわけだ。セランド氏は、「Verticaは、あくまでもビッグデータを活用するためのプラットフォームです。ビジネスパートナーとの協業により成り立っています」と言う。
その協業の中でも力を入れているのが、Hadoopとの連携。Hadoopは「大量データをカタログ化し整理するのに向いている」とのこと。しかし高度な分析となると必ずしも得意ではない。なので、その部分はVerticaが担う。「HadoopとVerticaの間で双方向にデータを動かすことで、顧客のニーズに応えています」とセランド氏は言う。