Shoeisha Technology Media

EnterpriseZine(エンタープライズジン)テクノロジーでビジネスを加速するための実践Webメディア

テーマ別に探す

莫大であいまいなデータから有益な情報を見つけるには / ビッグデータで安全運転?!

2013/07/29 13:40

「3つのV」、これはビッグデータを説明する際に、たびたび登場する言葉だ。「Volume(量) 」「Variety(種類、多様性)」「Velocity(速度・頻度)」という、Vの付く3つの単語がビッグデータを説明するキーワードになる。これに、さらにもう1つVを加えているのがIBMだ。「『Veracity』、IBMの4つ目のVはこれです」と言うのは、先日開催されたIBMのビッグデータ・ソリューションを紹介するイベント「Big Data Technology Forum 2013」の基調講演に登壇した日本アイ・ビー・エム ソフトウェア事業 インフォメーション・マネジメント事業部長の塚本眞一理事だ。SNSやTwitterなどでつぶやかれているような「あいまいな」情報を、いかにビッグデータとして活用するのか。そのためには情報のVeracity、つまりは正確さを担保することが重要になる。

4つ目のV、そしてストリーム・コンピューティングがIBMのビッグデータの特長

塚本氏眞一氏
塚本氏眞一氏

 「膨大で不確実な情報から、どのような価値を見出すのか、それが命題となっています」(塚本氏)

 そのために利用できるテクノロジーとして提供しているのが、IBMが長年手がけている自然言語処理の技術だ。つぶやきのようなあいまいなテキスト情報を、そのまま解析できるのが強味。これに関しては、IBMが長年やってきたことであり、大きな優位性があると自信を見せる。

 さらに、そういったあいまいな情報を含め、センサー情報など増え続けるデータを「すべて蓄積するのか?」と塚本氏は問いかける。

 たしかに、HadoopベースのInfoSphere BigInsightsなどを活用して、莫大なあいまいなデータを高速に処理し有益な情報を見つけ出すことはできる。とはいえ、無尽蔵にストレージを用意できるわけではないし、さらには莫大なデータのすべてが有益な情報ではない。そこで、IBMが以前から取り組んでいるのが、ストリーム・コンピューティングだ。

「このストリームデータ処理に早くから着目しているのも、IBMのビッグデータソリューションの特長です。ストリーム・コンピューティングをうまく使えば、ビッグデータ分析のコストを下げられます」(塚本氏)

 ストリームデータ処理の効果は、コストの低下だけではない。「データをストアしないという選択肢 ーストリーム・コンピューティングによる真のリアルタイム性の実現」というタイトルで講演したのは、日本アイ・ビー・エム インフォメーション・マネジメント事業部 テクノロジー・エバンジェリストの中林紀彦氏。

 「データをリアルタイムに処理するというアーキテクチャが、今ものすごく注目されています」と言う中林氏。これは、データを溜め込んでから分析するのは、過去に何が起こったかを解析するもの。ある意味で、従来のリレーショナルデータベースが得意としてきた分野であり、仮に高速なインメモリデータベースになったとしても、過去に対する分析であることには変わりはない。

 対して、データを溜め込まず、発生したデータがメモリ上にあるうちに集計、分析の処理をしてしまうのが、IBMが力を入れているストリーム・コンピューティングだと、中林氏は説明する。

「今までのデータベースのアーキテクチャとは異なり、新しいデータ処理アーキテクチャで実現しています。これは、20年に1度あるかないかのアーキテクチャの転換です」(中林氏)

中林紀彦氏
中林紀彦氏

 Hadoopのような新しいデータベース技術、さらにはこのリアルタイム処理のストリーム・コンピューティングなどを活用していかないと、本当の意味でのビッグデータ活用はなし得ない、というのがIBMの主張だ。今後利用が促進しそうな位置情報活用などは、たしかにデータは莫大だし溜め込む前にリアルタイム処理することで、新たなイノベーションが生まれそうな分野ではある。

 このストリーム・コンピューティングは、IBM InfoSphere Streamsというソフトウェアで実現できる。新たなアーキテクチャであり、データベースエンジニアにはちょっと敷居が高いと思われるかもしれないが、インストールも簡単で、開発などもほとんどがGUIによるドラッグ&ドロップの操作で行えるそうだ。90日間限定だが試用版も用意されているので、ストリームデータ処理に興味のあるエンジニアは、一度IBMのサイトからダウンロードして試してみてはいかがだろうか。

※この続きは、会員の方のみお読みいただけます(登録無料)。


著者プロフィール

  • 谷川 耕一(タニカワ コウイチ)

    EnterpriseZine/DB Online チーフキュレーター ブレインハーツ取締役。AI、エキスパートシステムが流行っていたころに開発エンジニアに、その後雑誌の編集者を経て、外資系ソフトウェアベンダの製品マーケティング、広告、広報などを経験。現在は、オープンシステム開発を主なターゲットにし...

バックナンバー

連載:週刊DBオンライン 谷川耕一

もっと読む

この記事もオススメ

All contents copyright © 2006-2017 Shoeisha Co., Ltd. All rights reserved. ver.1.5