ビッグデータのプラットフォームはオンプレミスからクラウドにシフトする
楽観できない中で必要となるのがグローバリゼーション、市場をグローバルに捉えるべきという意見が多い。それと、競争力を強化するために、情報のさらなる活用を挙げるところも。このあたりを実現しようとすれば、クラウドの活用、ビッグデータの活用という話につながるわけで、これは2013年の動向から大きく変化するものではなさそうだ。とはいえ、クラウドやビッグデータ活用は様子見を決め込んでいた状況から、2014年は実践段階に入るのは確実だろう。実践のためには確実な自社ポジションの見極めが必要であり、さらにやると決めたらスタートダッシュをどこまでできるかでライバルとは差が出そうな予感がする。
そんな中、ビッグデータ活用の新たな領域で興味深い発表が先週あった。それが、Amazon Web Services(AWS)の「Amazon Kinesis」だ。これは、先日米国で開催されたAWSの年次イベント「re:Invent」で紹介されていた新サービスの1つ。いわゆるストリーミングデータをリアルタイム処理するためのクラウドサービスだ。ビッグデータを溜めてから分析するというのではなく、データが生まれるそばからどんどん処理してしまうというもの。
溜めてから処理するとなると、どんなに強力なプラットフォームを持っていても、溜める、整理する、分析するという処理が入るために時間がかかる。溜めずに処理するのが、ストリーミングデータ処理だ。溜めてから分析するほど複雑で高度な分析はできないかもしれないが、ある一定のルールに基づいて瞬時に処理して判断し、アクションに結びつける。ECサイトなどでのリコメンドや金融機関での不正取り引きの検知、製造業なら製造ラインに設置されたセンサーから得られる情報をリアルタイムに処理してなんらかの異常をいち早く検知するなどといった利用が考えられる。
高度な分析は難しいが、いったんため込んだビッグデータを高度に分析し、そこで得られた分析モデルをストリーミングデータの処理に流用するといった使い方も出てきており、昨今では単純なルール処理より高度な分析が可能になってきている。
そんなストリーミングデータの処理を、クラウドでできるようにしたのがAmazon Kinesisだ。数十万のソースから1時間あたり数百テラバイトのデータを収集し処理できるそうで、Amazon Kinesisのアプリケーションではリアルタイムダッシュボードの構築、例外のキャプチャとアラートの生成、推奨事項の調整などがリアルタイムに行えるようだ。Kinesisの登場で、ため込んだデータ処理のRedshift、NoSQLタイプのデータに対応するDynamoDBとともに、ビッグデータを扱うためのサービスラインナップが、AWSにはすべて揃ったことになる。
これらのサービスが、すべてAWSのクラウドで完結するというのはかなりの優位性を発揮すると思われる。一部がオンプレミスだったり他のクラウドサービスの上にあったりすると、どうしてもデータを移動するというリソースコストが発生してしまう。ビッグデータのサイズが大きければ大きいほど、無駄な時間とコストが費やされることに。それがAWSに統合されることで、データはAmazon S3などで一元的に管理しやすくなり効率も増すはずだ。
さらに有利なのが、これがクラウドのサービスということ。すぐに始めることができ、最初は小さく初めて大きく成長させることも容易だ。最初から莫大なハードウェア、ソフトウェア投資が必要ないというのも、ビッグデータの実践的な活用ではスタートダッシュを加速する大きな要因になるだろう。
来年にかけ、このビッグデータ関連のAWSの動きに追随してきそうなのは、IBMだろう。IBMは、来年以降、買収したSoftLayerのサービスの上に次々と自社ソフトウェアを載せサービス化してくるのは確実だ。このビッグデータ活用をクラウドでというところは、OracleやMicrosoftは今ひとつ出遅れている感がある。とはいえ彼らが、今後どう動いてくるのかも注意しておく必要はありそうだ。一方で、Treasure Dataのようなベンチャー企業が、この領域で活気づいてきているのも注目だ。とにもかくにも、ビッグデータ活用のフィールドとして、2014年はクラウドがさらに台頭してくることは間違いないだろう。