情報爆発とビッグデータは何が違うのか
オープニングの特別講演に登壇したのは、東京大学 生産技術研究所 教授の喜連川 優氏。日本における大規模データ処理研究の第一人者である。
はじめに喜連川氏は、2000年代に自らが主導した文科省の「情報爆発時代に向けた新しいIT基盤の研究」プロジェクトと、経産省の「情報大航海プロジェクト」を紹介した。増大するデジタルデータから、いかに有益な情報を拾い出すかという考え方によるこのプロジェクトは、今日のビッグデータの考え方の先鞭をつけたともいえるが、当時はなかなか理解が得られず、「情報大航海プロジェクト」にいたっては、「日の丸検索エンジン」のみが強調され、予算の無駄遣いという批判まであったという。しかしその目的のひとつは、それまでの著作権法などの縛りによる日本のITビジネスへの制約状況を改善するというものであった。実際、文科省への働きかけで検索ビジネスの法的問題がクリアになり、グーグルとは別の日本の検索ビジネスがたちあがったのは、このプロジェクトの成果であるという。
ビッグデータについては、「情報爆発では、情報の増大をネガティブに捉える傾向があったが、現在のビッグデータはポジティブに捉えられている」と語り、「膨大な情報の解析が社会の様々な分野での効率化を生んできている」と述べた。また、ビジネスだけではなく、データを扱うサイエンスの領域にも飛躍的な進化があるという。先端的なゲノム解析や天文学などの研究者の現場では、膨大なデータの観察とシミュレーションをおこなうことによる成果が現れており、これまでとは違った「データ・セントリックな科学」が誕生しているのだという。
モノからの情報は第4のメディア
次に喜連川氏は、大量のセンサーによる「モノ」からのデータの発信を、これまでの画像・映像、音声、テキストに続く「第4のメディア」と見なす考え方を示した。情報の織りなすサイバー世界(Cyber World)と実世界(Physical World)の相互変換の循環的なプロセスを仕組みとして利用する社会のサービスが登場してきており、ビッグデータの活用の可能性は、こうした「サイバー・フィジカルなサービス」にあるという。
そして、3.11の震災直後のツィッターのメッセージが伝播していく様子の画像を紹介し、ビッグデータによるリアルタイムな社会状況の可視化の可能性を示した。
また、言語処理の分野でもビッグデータは、活用されていると語る。これまでのグーグルの検索では不可能だった複雑な質問、たとえば「農業の再生を考える人材の養成は?」「高齢化社会で成功するビジネスは?」に対する回答も、過去の新聞記事などの膨大なテキストを蓄積し、意味の解析を行うことで応答が可能になるのだという。
これらは情報源を拡大化することにより性能が上がるという、ビッグデータ活用の可能性である。こうしたいくつかの可能性を紹介した上で、いくつかの解決すべき課題があることを示した。すべてのデータはクリーンではなく、すべてを蓄積するわけにはいかないこと、メタデータがないと解析できない情報があること、そのためのプラットフォームをつくる必要があることなどである。そして最後に最も重要な課題として「有効活用のためのプライバシー問題もある。法制度の再検討も必要」と述べた。