SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

直近開催のイベントはこちら!

EnterpriseZine Day 2022

2022年6月28日(火)13:10

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

週刊DBオンライン 谷川耕一

莫大であいまいなデータから有益な情報を見つけるには / ビッグデータで安全運転?!


「3つのV」、これはビッグデータを説明する際に、たびたび登場する言葉だ。「Volume(量) 」「Variety(種類、多様性)」「Velocity(速度・頻度)」という、Vの付く3つの単語がビッグデータを説明するキーワードになる。これに、さらにもう1つVを加えているのがIBMだ。「『Veracity』、IBMの4つ目のVはこれです」と言うのは、先日開催されたIBMのビッグデータ・ソリューションを紹介するイベント「Big Data Technology Forum 2013」の基調講演に登壇した日本アイ・ビー・エム ソフトウェア事業 インフォメーション・マネジメント事業部長の塚本眞一理事だ。SNSやTwitterなどでつぶやかれているような「あいまいな」情報を、いかにビッグデータとして活用するのか。そのためには情報のVeracity、つまりは正確さを担保することが重要になる。

4つ目のV、そしてストリーム・コンピューティングがIBMのビッグデータの特長

塚本氏眞一氏
塚本氏眞一氏

 「膨大で不確実な情報から、どのような価値を見出すのか、それが命題となっています」(塚本氏)

 そのために利用できるテクノロジーとして提供しているのが、IBMが長年手がけている自然言語処理の技術だ。つぶやきのようなあいまいなテキスト情報を、そのまま解析できるのが強味。これに関しては、IBMが長年やってきたことであり、大きな優位性があると自信を見せる。

 さらに、そういったあいまいな情報を含め、センサー情報など増え続けるデータを「すべて蓄積するのか?」と塚本氏は問いかける。

 たしかに、HadoopベースのInfoSphere BigInsightsなどを活用して、莫大なあいまいなデータを高速に処理し有益な情報を見つけ出すことはできる。とはいえ、無尽蔵にストレージを用意できるわけではないし、さらには莫大なデータのすべてが有益な情報ではない。そこで、IBMが以前から取り組んでいるのが、ストリーム・コンピューティングだ。

「このストリームデータ処理に早くから着目しているのも、IBMのビッグデータソリューションの特長です。ストリーム・コンピューティングをうまく使えば、ビッグデータ分析のコストを下げられます」(塚本氏)

 ストリームデータ処理の効果は、コストの低下だけではない。「データをストアしないという選択肢 ーストリーム・コンピューティングによる真のリアルタイム性の実現」というタイトルで講演したのは、日本アイ・ビー・エム インフォメーション・マネジメント事業部 テクノロジー・エバンジェリストの中林紀彦氏。

 「データをリアルタイムに処理するというアーキテクチャが、今ものすごく注目されています」と言う中林氏。これは、データを溜め込んでから分析するのは、過去に何が起こったかを解析するもの。ある意味で、従来のリレーショナルデータベースが得意としてきた分野であり、仮に高速なインメモリデータベースになったとしても、過去に対する分析であることには変わりはない。

 対して、データを溜め込まず、発生したデータがメモリ上にあるうちに集計、分析の処理をしてしまうのが、IBMが力を入れているストリーム・コンピューティングだと、中林氏は説明する。

「今までのデータベースのアーキテクチャとは異なり、新しいデータ処理アーキテクチャで実現しています。これは、20年に1度あるかないかのアーキテクチャの転換です」(中林氏)

中林紀彦氏
中林紀彦氏

 Hadoopのような新しいデータベース技術、さらにはこのリアルタイム処理のストリーム・コンピューティングなどを活用していかないと、本当の意味でのビッグデータ活用はなし得ない、というのがIBMの主張だ。今後利用が促進しそうな位置情報活用などは、たしかにデータは莫大だし溜め込む前にリアルタイム処理することで、新たなイノベーションが生まれそうな分野ではある。

 このストリーム・コンピューティングは、IBM InfoSphere Streamsというソフトウェアで実現できる。新たなアーキテクチャであり、データベースエンジニアにはちょっと敷居が高いと思われるかもしれないが、インストールも簡単で、開発などもほとんどがGUIによるドラッグ&ドロップの操作で行えるそうだ。90日間限定だが試用版も用意されているので、ストリームデータ処理に興味のあるエンジニアは、一度IBMのサイトからダウンロードして試してみてはいかがだろうか。

次のページ
自動車の各種センサーデータをWindows Azureに集めビッグデータ活用ができる環境

この記事は参考になりましたか?

  • Facebook
  • Twitter
  • Pocket
  • note
週刊DBオンライン 谷川耕一連載記事一覧

もっと読む

この記事の著者

谷川 耕一(タニカワ コウイチ)

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/5018 2013/07/29 14:09

Job Board

PR

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

2022年6月28日(火)13:10

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング