EnterpriseZine(エンタープライズジン)

EnterpriseZine(エンタープライズジン)

テーマ別に探す

非構造化データ、構造化データからストリームデータまで/IBMが考えるBig dataとHadoopの関係

edited by DB Online   2011/07/29 07:00

企業が扱うBig dataは、なにも新たに取得する非構造化データだけではない。これまでもずっと活用してきたトランザクショナルなデータも、大量に存在する。それらは当然ながらRDBMSに格納されており、Big dataに対しなんらかの分析を行いたければ、それを含め処理ができなければならない。―IBMの考えるBig data、そしてHadoopの活用について話を訊いた。

企業の扱うBig dataはRDBMSの中にすでにある

 「Hadoopをビジネスで利用する際の1つの問題は、HadoopがOSの上のアプリケーションだということです。Hadoopで利用するファイルシステムであるHDFSもまた、アプリケーションの中にあります」

「企業が扱うBig dataは非構造化データだけではない」土屋氏
「企業が扱うBig dataは
非構造化データだけではない」土屋氏

 日本アイ・ビー・エム株式会社 ソフトウェア事業 インフォメーション・マネジメント事業部 ワールドワイド・ビッグデータ・タイガーの土屋 敦氏は、Big dataを扱うための方法として注目を集めているHadoopを活用するには、とにかく一旦Hadoopというソフトウェアを経由しHDFSにデータを格納しなければならず、そこからデータを取り出す際にも必ずHadoop経由でHDFSにアクセスしなければならないと語る。

 これは、当たり前と言えば当たり前のこと。とはいえ、すでに扱いたいデータがRDBMSの中に格納されている場合もある。その際にHadoopで処理したければ、RDBMSからHDFSにデータを移動させなければならないのだ。データ量が少なければ問題にならないかもしれないが、大量にデータがあれば手間と時間は無視できるものではない。

 企業が扱うBig dataは、なにも新たに取得する非構造化データだけではない。これまでもずっと活用してきたトランザクショナルなデータも、大量に存在する。それらは当然ながらRDBMSに格納されており、Big dataに対しなんらかの分析を行いたければ、それを含め処理ができなければならない。

 「IBMでは、Big dataは分析の対象と捉えています。現状ではそれに注力しており、そのためにはRDBMSもHadoopも両方扱えなければなりません。Hadoopをうまく使えるだけでは、企業がBig dataを活用するには不十分」

 こう指摘するのは、ソフトウェア事業 インフォメーション・マネジメント事業部 マーケティング・マネージャーの中林紀彦氏。同氏によれば、Big data活用のためには、Hadoopと既存RDBMSを連携させる仕組みが必須になるという。

※この続きは、会員の方のみお読みいただけます(登録無料)。


※この続きは、会員の方のみお読みいただけます(登録無料)。


著者プロフィール

  • 谷川 耕一(タニカワ コウイチ)

    EnterpriseZine/DB Online チーフキュレーター かつてAI、エキスパートシステムが流行っていたころに、開発エンジニアとしてIT業界に。その後UNIXの専門雑誌の編集者を経て、外資系ソフトウェアベンダーの製品マーケティング、広告、広報などの業務を経験。現在はフリーランスのITジャーナリストとして、クラウド、データベース、ビッグデータ活用などをキーワードに、エンタープライズIT関連の取材、執筆を行っている。

バックナンバー

連載:DB Online Monthly Special

もっと読む

All contents copyright © 2007-2020 Shoeisha Co., Ltd. All rights reserved. ver.1.5