「ビッグデータという言葉は、特別に新しいものではありません。2000年か2001年には生まれたもので、すでに12、3年も使われています」と言うのは、HPのビッグデータソリューションの1つ「HP Vertica」のマーケティング担当バイスプレジデント クリス・セランド氏だ。ビッグデータはたんにボリュームが大きいデータというだけではなく、ベロシティ(頻度)、バラエティ(種類)も大きく、それが増え続けている。どんどん増えてしまうので、企業はなかなかそれを戦略的に活かすことができないのが現状だ。
ビッグデータの活用ではカラムナー型アーキテクチャが最適

このビッグデータの課題を解決するために生まれたのが、Verticaだ。データベースの世界的な権威であるマイケル・ストーンブレイカー氏が、開発に携わったことでも有名な新しいデータベース製品。旧来のOLTP系データベースと異なり、最近流行のカラムナー型のアーキテクチャを持ち、大量データの分析に特化している。「カラムナー型として世界で最初の製品ではないが、かなり初期から開発されているものです」と、すでにこの領域に置いて技術の蓄積があることをセランド氏は説明する。
このVertica、ポイントとなるのは高速な分析処理性能、高い拡張性、そしてオープンなアーキテクチャと最適化されたストレージの4つ。高速な分析性能については、「あまりにも処理が速いため、顧客からは本当に分析を行っているのかどうかが分からないと、疑われることもあります」とセランド氏。増え続けるデータにも、「事実上、無限に拡張できます」とのことだ。
ストレージの最適化は、アーキテクチャがカラムナー型であることから生まれる効率のいい圧縮機能によるもの。旧来のデータベースに比べ10から30倍のデータを格納できる。この圧縮率の高さは、ストレージを節約するだけでなく、IOを減らして性能の向上にも貢献する。この圧縮の効果は、MicrosoftやOracleなども同様に主張しているところ。
Verticaはビッグデータ分析に特化しているとはいえ、ビッグデータでやりたいことすべてをVerticaだけでできるわけではない。適宜、BI/BAツールやETLツールなどと連携する必要がある。そのために、オープンなアーキテクチャを持っているというわけだ。セランド氏は、「Verticaは、あくまでもビッグデータを活用するためのプラットフォームです。ビジネスパートナーとの協業により成り立っています」と言う。
その協業の中でも力を入れているのが、Hadoopとの連携。Hadoopは「大量データをカタログ化し整理するのに向いている」とのこと。しかし高度な分析となると必ずしも得意ではない。なので、その部分はVerticaが担う。「HadoopとVerticaの間で双方向にデータを動かすことで、顧客のニーズに応えています」とセランド氏は言う。
この記事は参考になりましたか?
- この記事の著者
-
谷川 耕一(タニカワ コウイチ)
EnterpriseZine/DB Online チーフキュレーターかつてAI、エキスパートシステムが流行っていたころに、開発エンジニアとしてIT業界に。その後UNIXの専門雑誌の編集者を経て、外資系ソフトウェアベンダーの製品マーケティング、広告、広報などの業務を経験。現在はフリーランスのITジャーナリスト...
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア