8月9日、EMCジャパンにおいて同社のGreenplumソリューションである「Greenplum DB」「Greenplum HD」、そして近々のリリースが予定されている「Greenplum Chorus」についての報道陣向け説明会が行われたので、それをもとに同社のビッグデータ戦略について分析してみたい。
ビッグデータの95%は非構造化データ
バズワードとなりつつあるビッグデータ(big data)という言葉。今後10年間で企業が抱える情報量は現在の50倍になるという試算もあり、これらのデータをどのように活用するかが、今後企業にとって、大きな課題となることは間違いない。
EMCジャパン データ・コンピューティング事業本部 テクノロジー&プロフェッショナルサービス部 部長 仲田總氏はこれらのデータの約95%が「非構造化データ」、すなわち画像データやWebコンテンツにあたると説明する。そして、これまでコンシューマでの利用が目立っていたこれらのデータが、企業や組織においても大きなシェアを占めることになるのは確実だという。
「非構造化データは、言ってみればデータベースに格納するのが難しいデータ。これらをいかにうまく取り込み、活用できるようにするのか。ここでの選択で企業活動に差がついてくることになる」と仲田氏。「たとえばCRM。音声だけでなく画像とともに応対するWeb電話を使ったコールセンターや、SNSで顧客同士がつながるシステムなどを提供できれば、顧客のロイヤリティは確実にアップするはず」と例を挙げ、ビッグデータの活用が顧客価値の創造につながることを強調する。
EMCでは1年をかけ、企業のビッグデータ活用を支援するソリューションとしてGreenplumラインナップを整えてきた。それが以下の3つだ。
- 構造化データを処理するDWH「Greenplum DB」
- 非構造化データを処理する分散データベース「Greenplum HD」
- 仮想的なデータマートをプロビジョニングする「Greenplum Chorus」
それでは、それぞれについて概要を解説しよう。