情報爆発とビッグデータは何が違うのか
オープニングの特別講演に登壇したのは、東京大学 生産技術研究所 教授の喜連川 優氏。日本における大規模データ処理研究の第一人者である。
はじめに喜連川氏は、2000年代に自らが主導した文科省の「情報爆発時代に向けた新しいIT基盤の研究」プロジェクトと、経産省の「情報大航海プロジェクト」を紹介した。増大するデジタルデータから、いかに有益な情報を拾い出すかという考え方によるこのプロジェクトは、今日のビッグデータの考え方の先鞭をつけたともいえるが、当時はなかなか理解が得られず、「情報大航海プロジェクト」にいたっては、「日の丸検索エンジン」のみが強調され、予算の無駄遣いという批判まであったという。しかしその目的のひとつは、それまでの著作権法などの縛りによる日本のITビジネスへの制約状況を改善するというものであった。実際、文科省への働きかけで検索ビジネスの法的問題がクリアになり、グーグルとは別の日本の検索ビジネスがたちあがったのは、このプロジェクトの成果であるという。
ビッグデータについては、「情報爆発では、情報の増大をネガティブに捉える傾向があったが、現在のビッグデータはポジティブに捉えられている」と語り、「膨大な情報の解析が社会の様々な分野での効率化を生んできている」と述べた。また、ビジネスだけではなく、データを扱うサイエンスの領域にも飛躍的な進化があるという。先端的なゲノム解析や天文学などの研究者の現場では、膨大なデータの観察とシミュレーションをおこなうことによる成果が現れており、これまでとは違った「データ・セントリックな科学」が誕生しているのだという。
モノからの情報は第4のメディア
次に喜連川氏は、大量のセンサーによる「モノ」からのデータの発信を、これまでの画像・映像、音声、テキストに続く「第4のメディア」と見なす考え方を示した。情報の織りなすサイバー世界(Cyber World)と実世界(Physical World)の相互変換の循環的なプロセスを仕組みとして利用する社会のサービスが登場してきており、ビッグデータの活用の可能性は、こうした「サイバー・フィジカルなサービス」にあるという。
そして、3.11の震災直後のツィッターのメッセージが伝播していく様子の画像を紹介し、ビッグデータによるリアルタイムな社会状況の可視化の可能性を示した。
また、言語処理の分野でもビッグデータは、活用されていると語る。これまでのグーグルの検索では不可能だった複雑な質問、たとえば「農業の再生を考える人材の養成は?」「高齢化社会で成功するビジネスは?」に対する回答も、過去の新聞記事などの膨大なテキストを蓄積し、意味の解析を行うことで応答が可能になるのだという。
これらは情報源を拡大化することにより性能が上がるという、ビッグデータ活用の可能性である。こうしたいくつかの可能性を紹介した上で、いくつかの解決すべき課題があることを示した。すべてのデータはクリーンではなく、すべてを蓄積するわけにはいかないこと、メタデータがないと解析できない情報があること、そのためのプラットフォームをつくる必要があることなどである。そして最後に最も重要な課題として「有効活用のためのプライバシー問題もある。法制度の再検討も必要」と述べた。
スマーター・アナリティクスとは何か
次に登壇したのはIBMコーポレーションのバイス・プレジデントであるInhi Cho Suh氏。「スマーター・アナリティクス ビッグデータ時代のビジネス変革とは」と題する講演をおこなった。
IBMがスマーター・プラネットというコンセプトを打ち出したのは4年前。それ以来、アナリティクスは進化し続け、その重要性は高まっている。IBMはこうした進化したアナリティクスを「スマーター・アナリティクス」と称し、ビジネスの変革を導くものと位置づけている。
MITスローンとの共同調査によると、アナリティクスを行うことで競合より優位になったと答えた企業が、2010年は37%であったのに対し、2011年には58%に増大した。また「競合企業に対して大幅に業績を上回っている」と回答した企業の割合は2.2倍に増えている。
そしてアナリティクスの対象は、従来の企業内データにとどまらず、社会全体におよび、業界全体の変革につながってきた。企業においても、1日の12テラバイトのツイートの分析、500万件の取引からの不正検知、100本の監視カメラによるビデオフィードの分析などがおこなわれているといった状況がある。しかもそのほとんどが、従来と異なる非構造化データである。こうした、量(Volume)、速度(Velocity)、種類(Variety)の増大こそが、ビッグデータの本質であるという。
IBMが手がけたビッグデータ・アナリティクスによる米国の事例として、医療機関のWellPoint社の例が語られた。米国では誤診断や医療ミスによるで死亡する患者が多い。IBMはワトソンという自動応用システムを用い、患者の応答に適用し医療支援システムとして活用している。
またノースカロライナ州での大学、McKesson社などの事例を紹介しながら、アナリティクスの変革推進の視点を次のようにまとめる。
1.顧客獲得や満足度の向上 --- 顧客離反管理やソーシャルによる顧客の感情分析による対策
2.業務効率改善 --- 予知保全、サプライチェーンの最適化、クレームの最適化
3.財務プロセスの変革 ーー ローリングプラン、予算予測、決算処理プロセスの自動化
4.リスク、コンプライアンス対策 ーー 業務・ポリシーのリスク管理、リアルタイムでの不正検知
こうした目的のために「情報→洞察→ビジネス成果」のサイクルを形成するのが、スマーター・アナリティクスの定義であるという。
OODA --- ビッグデータの戦略コンセプト
次にInhi Cho Suh氏は、ビッグデータを企業が戦略として活用する際に参考になるコンセプトとして、「OODA --- Observe(観察)、Orient(適応)、Decide(決定)、Act(行動)」という言葉を紹介した。「OODA」はもともとアメリカの軍隊の意思決定理論である。戦闘機パイロットのジョン・ボイドが空戦の経験から生み出したモデルであり、洞察と応答の速度が勝利につながるという考え方だ。このOODAは、今日のビッグデータの戦略にも通じるものだという。
こうした目的と戦略によるビッグデータ・アナリティクスは、ほとんどすべての産業の分野に適応できる。そのためにIBMは従来の定型的、分析的アプローチと創造的、直観的なアプローチを統合したアプローチで取り組んでいる。これは人間の右脳と左脳のモデルにも近いという。
このような研究所や世界最大の数学・統計部門によって生み出された知見をフル活用できることが、IBMの強みであろう。すでにその成果として、米国では大規模な風力発電のタービン設置プロジェクト、大西洋北西部のスマートグリッドのデモンストレーション・プロジェクト、医療機関での活用プロジェクトが進んでいる。
最後に、Inhi Cho Suh氏は「他のベンダーは、データをアナリティクスに近づけるのに対して、IBMはアナリティクスをデータに近づける」と述べた上で、ネティーザとDB2を連携させたアナリティクスアプライアンスや、Hadoop、ストリーム・コンピューティング、データウエアハウスを統合したプラットフォームを紹介し、講演を締めくくった。
【関連記事】
・IBM、データベース管理ソフトの新製品「IBM DB2 V10.1」を発表
・DB2、System z、Netezzaを融合させるIBMのビッグデータ戦略
・日本IBMがDB2 Analytics Acceleratorを発表
・IBMのビッグデータ分析が、デンマークVestas Wind Systemsの風力発電のスマート化に活用
・Information On Demand 2011開催、洞察を行動に変えるIBMのアナリティクス
・IBMがビッグデータ関連の最新技術、事例を一挙に公開するカンファレンス「Information On Demand Conference Japan 2012」を開催