ビッグデータの課題を紐解くInsight Qube
谷川: アナリストの生熊さんにお聞きしたいんですが、ビッグデータとは何なのか、そしてその課題を教えてもらえますか?
生熊: これまでのマシンやデータベースなどでは扱いきれない量のデータだったり、更新速度が速かったり、ちょっと扱いにくいデータをビッグデータととらえていますが、やはりデータ量が多いと、これまでの一般的なリレーショナルデータベースでは限界が来るんです。そこでビッグデータを処理するアプライアンスやHadoop、インメモリデータベースなどが注目されています。ビッグデータでは、こういった技術の中からひとつの技術だけでなく、複数の技術を適材適所に活用していくことが求められるのだと思います。
谷川: 小幡さんはインサイトテクノロジーでデータベースのパフォーマンスチューニングを手がけていますが、小幡さんから見たビッグデータの課題は?
小幡: 基幹システムのデータベースで過去10年間のデータを持ち続け、それを動かしているという企業はまずありません。バッチが動かなくなるので、数ヶ月分だけをオンラインに残してあとは消去するか、まとめておくかです。でも本当は消してしまうなんてもったいない。そのためにチューニングしたり、昔のデータをそのまま持っておけるハードウェアがあるんじゃないかと考えました。
谷川: そこで開発したのがInsight Qubeというわけですね。IBMやOracleなどの大手ベンダーが数億円規模のマシンを提供している中でInsight Qubeは数千万円ですが、数億円のマシンと比べて何が違うんですか?
小幡: できることは同じですね。お金のある人は数億円のマシンを買うといいと思いますよ(笑)。
われわれが顧客のコンサルティングをしていて矛盾に感じるのは、1億円のハードウェアを導入するとパフォーマンスを2倍にすることはできるんですが、1億円を出しても2倍にしかならないという点です。しかも顧客が求めているのは20倍のパフォーマンスです。それを実現するには、ハードウェアのアーキテクチャを全部変える必要があると思いついた。
Insight Qubeは、PCI ExpressやInfiniband、SSDなどのオープンなハードウェアを組み合わせて開発したマシンです。価格は、最上位機種のANACONDAでも2000万円からで、COBRAは1000万円からとなります。ANACONDAは高密度で電源の二重化も施しています。電源を2個配置するため、マザーボードも一般的なATX仕様ではありません。大手メーカーが採用しているようなマザーボードと同等のものです。
ただ、ATX準拠でないマザーボードは、新しい技術が出るとケースごと替える必要があります。つまり5年もたてば新しくて安価な技術に抜かれてしまうのに、それに2億円も出せませんよね。
谷川: 結果、何年も前のアーキテクチャを使い続けることになると。
小幡: そうなんです。買った時から時代遅れになってしまいます。一方のCOBRAは、ATX準拠であることを追求しています。ATX準拠にすると、柔軟性が高くなり、新しい技術をどんどん採用できる。だからCOBRAではインターフェースも最新のPCI ExpressであるIvy Bridgeに対応し、データ転送速度がANACONDAの6GB/secより高速な10GB/secとなっています。両製品共にハードディスクにはSSDを採用しています。もちろんANACONDAの方がOLTPでも使える高価なSSDを採用していて、2000万円のほとんどがSSDの価格といってもいいでしょう。
そして、R&D専用マシンとして使ってもらうために、無料のPYTHONも用意しました。こちらも6GB/secの速度が出ます。
谷川: タダであげちゃうんですか?
小幡: タダです。ただし、ノーサポートですよ。ビッグデータを使って新しいビジネスモデルを作りたい、次のFacebookのようなアイデアを持っている、といったユーザーをPYTHONで応援したいですね。そこで、インサイトテクノロジーがコンサルティングやノウハウを提供するといったようなビジネスができればいいと思っています。