EMCは一般企業が容易に利用できるHadoopを提供する
「いままでの定型的なデータだけでは、企業のサービスや製品の戦略は限られたものだけになってしまいます」
―EMCジャパン データ・コンピューティング事業本部 テクノロジー & プロフェッショナルサービス部 テクニカルコンサルタントの草薙昭彦氏は、ビジネス環境の不確定性が高まる中、これまでの定型的なデータだけでは、新しいサービスや製品を生み出すための画期的な戦略を打ち出すのが難しいと指摘する。
一方で、企業の扱うデータは急速に増えている。
データベースに正規化して格納した情報を、これまで通りに定型処理し活用することはもちろん必要だ。それに加え、たとえばインターネットから得られるさまざまなログデータ、画像、音声、映像、さらには各種センサーから得られる多様なデータが続々と増えており、これらをどうビジネスに生かしていくかが新たな課題となっている。
「他の企業がまだ利用していないデータを活用できれば、それはその企業にとっての優位性につながります」(草薙氏)
まだ利用されていないデータの多くは非構造化データであり、それを扱うのに適している方法として注目を集めているのがHadoopだ。Hadoopは大容量な非構造化データを扱うのに、性能的にもコスト的にも優位性があり、スケールアウトで容量増加にも対応しやすい点で注目を浴びている。
ところで、いざ企業がHadoopを使おうとすると、さまざまな課題に直面する。Apache Hadoopは、いわゆるオープンソース製品であり、先進的な機能を取り込んで短期間に頻繁に更新される。オープンソース製品の先進性からくる高性能を得ようとすれば、自社内にそれを十分に扱える技術力が必要となる。先進的な技術者を数多く抱えている一部の大手Eビジネス企業であれば、これを活用できるだろう。
その一方で、一般企業がソフトウェアに求めるのは、信頼性、安定性、高性能だ。草薙氏によれば、「Hadoopが、市場で広く使われるようになるには、信頼性、安定性、高性能という要件を同時に満たす必要がある」という。
実際にいまApache Hadoopを利用している企業では、活用のためのノウハウをいまだ確立できずにいる。そのため、コストも時間もかけ使いこなそうとしているところだ。オープンソースであれば、単一障害に上手く対応できない、プログラム実装に不安がある場合に、それを解決するのは利用者自身だ。とはいえ、一般企業が使う「商用」となればそうはいかない。そのため、EMCでは、信頼性と使いやすさ、そしてさらなるパフォーマンスの向上という3つの柱を立て、Hadoopの商用製品であるEMC Greenplum HDを提供していくという。
「トラディッショナルな企業では、いままでのシステム管理と同じような仕組みに組み入れられる必要があります。そのため、通常利用しているミドルウェア製品と同じように管理できる必要があるのです」(草薙氏)
このあたりが、EMCがHadoopを商用製品化する際のポイントとなる。そして、オープンソース製品をベースにしたものではあるが、EMCのようなエンタープライズ系製品で実績ある企業が提供し、保守サービスを行えることも、企業にとっては極めて重要になるだろう。