データレイクを使ったデータ活用ソリューションをEMC Federationで提供する
このデバイスから得られる膨大なデータを活用する世界、当初は消費者向けの領域が目立っていた。それがここに来て各種センサーなどの活用で、製造業などBtoBの世界にも広がりを見せている。これには製造ラインなどに取り付けられたセンサーを活用する世界もあれば、製品そのものにセンサーを搭載し利用状況などをリアルタイムにモニターする世界もある。また、スマートフォンなどのモバイルデバイスからは、製品を利用したユーザーのソーシャルネットワークへの発言などをリアルタイムに収集する仕組みもある。
このようにBtoBの世界でも行動データがどんどん集まることに。集まったデータを取りこぼすことなく、企業は適切に管理し活用できる環境が早急に必要だ。このどんどん生まれるデータを効率よく溜める仕組みを、EMCなどいくつかのベンダーでは「データレイク」と呼んでいる。集まってくる「すべて」のデータをデータレイクにとにかくあまり手を加えずに溜めるのだ。
既存の基幹系システムのデータもあれば、センサーデータ、ソーシャルネットワークやオープンデータなど外部からやってくるデータもある。さらに今後増えそうなのが、企業間連携により発生するデータ。グループ会社やパートナーなどと連携し、企業間で共有することで新たな価値が出るデータだ。
行動データがデータレイクに溜められ、それを分析して結果をモバイルアプリケーションなどにすぐに反映させる。そのためにはアジャイル開発で素早くロジックを変更したり、サービスを追加したりする必要がある。そして新しくなったアプリケーションから生まれるデータを再びデータレイクに溜め、分析を行うというサイクルになる。
「多くのベンダーは、データを溜めて分析するところまでは提供しています。EMCは結果をビジネスロジックに反映するところまでやります。このデータレイクを使ったサイクルを回すスピードが大きな価値になります。アジャイルでぐるぐる回す、そのすべてを提供できるのがEMC Federationです」と言うのは、EMC ジャパン株式会社 執行役員 グローバル サービス統括本部 プロフェッショナル サービス事業本部長の山口浩直氏だ。
EMCなので、データを溜めるデータレイク部分にはストレージベンダーとしての強みがあるだろう。それに加え、Pivotalに移った分析プラットフォームのGreenplumもある。さらにPivotalにはアジャイル開発のために活用できるCloud FoundryベースのPaaSがある。そしてもう1つ、データサイエンティストの養成にEMCはいち早く取り組んできたことで、データを解析しビジネスロジックに反映させられるデータサイエンスチームもある。そして、これら一連のデータの流れをセキュアに実現するためには、RSAのセキュリティのソリューションも必要だ。
「データサイエンティストがいるだけではビッグデータの活用はだめです。チームを作ってやる必要があり、チームワークが大事です。それと、アプリケーションがアジャイルでぐるぐる回るので、インフラもそれに対応できないとだめです」(山口氏)
アプリケーションを「アジャイルでぐるぐる回す」ためのインフラは、VMwareの仮想化技術で実現する柔軟なクラウドとなる。つまり、EMCはデータレイクを使ったビッグデータ活用のソリューションを、EMCという1つの会社で実現するというのではなくEMCグループ全体のFederationで実現するという。
そのためにEMCでは「フェデレーション ビジネス データレイク ソリューション」を発表した。これはEMCファミリーとなるEMC、Pivotal、RSA、VCE、VMwareという5つの組織が協業するFederationの形で提供するものだ。たんにそれぞれが提供する製品同士が協調して利用できるようにするだけでなく、営業アカウント情報の共有などを行い組織間で協力して顧客をサポートする体制も整えている。