ビッグデータ利活用に必要な技術をすべて統合して提供
CSPFは、リアルワールドの写像である情報を一元的にコントロールするというコンセプトで作られている。その全体像について戦略企画統括部の田崎裕二氏は「ビッグデータのリアルタイム処理と、統合・分析・利用に必要な技術をすべて統合したプラットフォームになっている」と説明する(図)。収集された様々なデータは、処理しやすい形に自動調整する仕組みが構築されており、そのために大きなSIが発生することがないのが大きな特徴となっている。
センシングにより収集されたデータは、その種類、性格などによりリアルタイム処理が求められるものと、バッチ処理で十分なものに分けることができる。ルールベースによるストリーム処理により現状把握と判断を行い、ナビゲーションに必要な処理をリアルタイムに実行する。プラットフォームに大量のデータが入ってくると、ネットワークなどに大きな負荷がかかるため、その振り分けを行うことで、うまくスケールアウトできる仕組みとなっている。それを可能にしているのは、富士通と富士通研究所が開発した、状態遷移モデルに基づく並列イベント・ストリーム処理技術だ。
また、ビッグデータの蓄積と、多様な情報の統合を効率よく行うため、自動カテゴリ格納技術によるストリームのアーカイブが行われる。使用頻度の高いデータはファイルのままで取り出しやすい場所に置いておき、年次でしか統計をとらないようなデータは圧縮するなど、様々な形での保存が可能になっている。
さらに、Hadoopによる分散ファイルシステム(HDFS)と、並列分散処理(MapReduce)によりビッグデータを短時間で分析し、将来予測やシミュレーションなどを行う。また、複数のWebサービスを統合するマッシュアップ技術により、必要なサービスの構築を簡単に行うことができるようになっている。
ビッグデータから意味を引き出す処理のため、データには位置情報や時間情報、人や機器の識別などのタグ付けをすることでデータを情報として管理する。そこから交通の混雑度合いや人の生活パターン、健康状態などのコンテキスト(タグ同士のつながり)を抽出し、新たなサービスの創出に結び付ける。
CSPFでは、ユーザーごとに安全なPaaS環境が提供されるが、テナント間で安全に情報交換を行うことによる情報融合の拡大が可能になっている。「ビッグデータは、情報を動かすこと自体が大きなコストになります。それをCSPFというクラウド上で行うことが可能なマルチテナントの環境であることは、大きなメリットだと考えています」(田崎氏)。テナント間の情報融合のセキュリティは、情報の仮想統合、権限管理と認可、情報の秘匿化を行う「定義駆動型フェデレーション」と呼ばれる技術により担保されている。
ビッグデータを利活用したビジネスの場を提供
富士通ではコンバージェンスサービスを、プラットフォーム、アプリケーション、人材で構成されたものとして提供する。サービス提供のパターンは、ユーザーそれぞれのアプリケーションを組むインテグレーション型に加え、位置情報サービスのSPATIOWLや位置情報、SNSで発信されたコメントなどを組み合わせたアプリ・サービス型と呼ばれるモデルも拡充している。現在、健康分野やエネルギー分野などで実証実験が行われている。さらにもう1つ、データ型と呼ばれているモデルがあり、これは富士通が所有しているデータなどを活用し、CSPFを情報が流通するプラットフォームにする構想となっている。
人材に関しては現在、BIやBAに携わってきた技術者が集められ、データ活用のデザインなどを行うキュレーターの育成が進められている。また、ユーザーからの問い合わせや依頼によるオンデマンド運用など、安全・安定で効果的なサービスの運用管理を提供するバリューセンター(仮称)も用意されている。2011年度第4四半期から提供されるCSPFは先行版という位置付けで、情報収集・検知、情報管理・統合、情報分析・並列分散処理、開発支援・運用管理が提供される。続いて2012年度の第2四半期に予定されているバージョン2では、情報利用、情報交換、情報分析・分析ツールなどの機能が提供される見込みだ。