DB Press

IBMのビッグデータ戦略にみるデータベースのこれから/NoSQLとRDBMSは「競合」から「融合」へ

更新日: 2012/02/10
公開日: 2011/06/01

通知

もういまさらという話ではあるが、企業が利用する情報の量が爆発的に増えている。昨今では、この莫大なデータは”Big data”と呼ばれ、これに対応するためにハードウェア、ソフトウェアのベンダーがさまざまなソリューションを展開している。去る5月23日には、IBMがBig data戦略の1つとして「IBM Information Managementソフトウェア」の新製品に関する発表を行った。

通知

情報の量だけでなく頻度と多様性にどう対処するか

「ビッグデータ処理は、量、頻度、多様性の

3つをきちんとカバーしてこそ」

「2009年に世界で約80万ペタバイトあったデータが2020年には35ゼタバイトになる」

―こう予測するのは、日本アイ・ビー・エム理事ソフトウェア事業インフォメーション・マネージメント事業部長の俵雄一氏。これは、「日本のデジタル放送の番組を10年間分蓄積するくらいの量に匹敵する」とのこと。ちなみにペタバイトの1000倍がエクサバイトで、そのさらに1000倍がゼタバイトという単位だ。

単純に量が増えるだけでなく、その中身も変わる。おもに増えるのは、非構造化データだ。

「Big dataの話題になると、大量データを処理できることに目が行きがちだが、量、頻度、多様性という3つをきちんとカバーできて初めてBig dataを処理できる」（俵氏）

ただ大量のデータを高速処理できるだけでなく、それが企業の業務に直結し、ビジネスを拡大するために活用できなければならない。

そのために今回IBMが提供するのが、Apache Hadoopの技術をエンタープライズ用途で利用できるようにした「InfoSphere BigInsight」と、データを溜めるのではなくストリーミング状態で活用する「InfoSphere Streams」という2つの製品の新バージョンだ。

前者はまさに大量データを効率的に扱うためのものであり、それを既存のビジネスデータと結びつけられるようDB2との双方向での連携や、管理コンソール、LDAP認証などのセキュリティ機能などをIBMが独自に追加している。

一方、大量データを集め、データベースに溜めてから分析するのがこれまでの考え方だが、溜めるのではなく発生したらそれをそのままストリームデータとして受け取って分析するのが「InfoSphere Streams」だ。

「Hadoopだけでは問題の解決はできない」

「この仕組みを使えば、1秒当たり1000万件のデータを処理できることがIBM内で検証済み」と日本アイ・ビー・エムソフトウェア事業インフォメーション・マネージメント事業部マーケティング・マネージャーの中林紀彦氏は胸を張る。

さまざまなセンサーがさまざまな場所に配置され、そこからネットワークを通じ次々とデータがやってくる。そういった大量のストリーミングデータに対し、リアルタイムにマイニングを施す機能を提供している。

「Big dataに対し、Hadoopだけでは問題の解決はできない。従来の構造化されたデータは当然ビジネスにおいては中核にあり、それに加え他の機能を連携させ利用する必要がある」（中林氏）

次のページ
競合する時代から連携、融合へ

この記事は参考になりましたか？

印刷用を表示

DB Press連載記事一覧: 東京ガス、「myTOKYOGAS」の開発内製化をTiDBで加速　エンジニアが事業を動かす環...

AIはデータ基盤の選定基準を変えるか？市場ニーズの変化、高まるClouderaの存在感

分社化から10年目を迎えたHPE──現地イベントで見えた変化、AI時代のインフラ戦略を明確...

もっと読む

この記事の著者: 谷川耕一（タニカワ　コウイチ）

EnterpriseZine/DB Online チーフキュレーターかつてAI、エキスパートシステムが流行っていたころに、開発エンジニアとしてIT業界に。その後UNIXの専門雑誌の編集者を経て、外資系ソフトウェアベンダーの製品マーケティング、広告、広報などの業務を経験。現在はフリーランスのITジャーナリスト...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事