Hadoopをエンタープライズで普及させるべく
「エンタープライズ領域で、オープンソーステクノロジーのHadoopを普及させるには、会社を興してやっていく必要があると考えました。それが成功の道だと信じて起業しました」と語るのは、HortonworksのStrategic Marketing担当バイスプレジデント John Kreisa氏だ。
同社では徹底的にオープンソースソフトウェアの開発環境に拘っており、その上でHadoopをエンタープライズのデータプラットホームとして、確固たる地位が得られるよう努力をしている。創業以来、着実な発展をしており、すでに従業員は260名規模にまで増え、150社以上のパートナー企業と協業し、顧客数も120社を超えている。
「我々のビジネスはかなり速いペースで成長しています。市場も同様に大きく成長しています」とKreisa氏。いまHadoopが普及している背景には、新しいデータソースが次々と出てきていること、そして企業も新しい種類のデータを利用したいと考えていることがある。新しいデータについては、既存のデータベースで扱うにはコスト効率面、技術面であまり向いておらず、Hadoopのほうが優位性があるものが多い。
「ここにHadoopの需要があり、Hadoopを活用できる企業は、競争優位性を持つことになります」(Kreisa氏)
導入のアプローチとしては、新しいデータソースを1つか2つHadoopに蓄積し、そこに新たなビジネスにフォーカスしたアプリケーションを構築するやり方がある。これで成果が出れば、さらにデータソースを増やし、より既存システムとの連携も密に行う。
また、一般化しつつあるのが、さまざまなデータソースから大規模な「データレイク」と呼ばれるHadoopを利用したビッグデータのインフラを作り、そこに複数のアプリケーションを載せるアプローチもある。データレイクは、データプールよりもより大規模なデータを表すもので、これがうまく動くようになればさらにデータソースを増やし、アプリケーションの成熟度も順次向上させることになる。