クラウドの次のトレンドは?
『クラウドの次は何がくるんでしょうか』。ここ2~3年、クラウド・コンピューティングを専門に調査活動を行ってきた城田氏が、メディアからの取材などで頻繁に受けた質問だという。その回答を模索してきた城田氏が最近になって見出したのが『ビッグデータ』というテーマだ。米国では、ビッグデータをテーマにしたカンファレンスが開催されるなど、注目を集めており、日本でも徐々に認知度が向上している。「クラウドの次にくるのはビッグデータではないか」(城田氏)。
まずは、ビッグデータの定義を確認しておこう。城田氏はビッグデータを「既存の技術では管理できないほどにボリュームが増え、複雑化したデータ」と規定する。現時点では、数十TBから数PB程度を指すことが多いが、企業によって管理できるデータの量は違うし、データの種類や性質によっても管理にかかるコストは異なる。当然、テクノロジーの進歩によってもビッグデータを定義するしきい値は変化するだろう。
重要なのは、現状のシステムで管理できないという点だ。例えば、明日の仕入れを考えるための過去データの分析に数日も掛かるようでは実際のビジネスの場では利用できない。単純なデータの量が多くて処理できないというだけではなく、ビジネスに活用することを考えた場合に実用に耐えないという相対的な意味を帯びているのが特徴だ。
城田氏によれば、ビッグデータにはボリューム以外に2つの特性がある。ひとつは、非構造化データが占める割合が多いこと。非構造化データとは、従来のリレーショナル・データベースには格納できないような、構造化されていないデータを指す。
電子メールやFacebook、Twitterなどに蓄積されたテキストデータ、あるいは、センサーから生み出されるデータなど、従来のITシステムが扱ってこなかった性質のデータが大部分を占めているのがビッグデータの特徴だ。もう一つは、データの用途。これまでのように「過去に何を起こっているのか」を分析するのではなく、データマイニングのような技術を使って、将来の予想に使われるようになると予想されている。
ビッグデータという考え方が登場した背景
昨年2月に発行された「エコノミスト」誌では、米国企業が直面するビッグデータの課題について取り上げている。例えば、2.5PBのPOSデータを保有し、1時間に100万トランザクションを分析処理している小売り大手のウォルマート。1日に50TB以上のデータが発生し、50PB以上のデータを処理しているネットオークション大手の「eBay」。ニューヨーク証券取引所では、1日あたり1TB以上の新規取引データが発生する。通信会社のAT&Tは、DWHに700PBのデータを格納し、一時間に200万件のクエリを実行しているという。
このような市場のニーズに対して、ベンダー側も戦略的に取り組む意向を表明している。例えば、IBMやTeradataはビッグデータというキーワードをここ1~2年で積極的に打ち出しているほか、EMCもビッグデータ対応製品を発表している。ユーザー企業側では扱うデータ量が増えており、ベンダー側もビッグデータを戦略的な取り組みとして掲げている、というのが現時点での状況だ。
過去から現在、さらに未来へと広がる分析の範囲
城田氏によれば、ビッグデータへの注目はBIの進化の流れと密接に関連しているという。「過去に何が起こったのか」を明らかにするレポーティングのためのツールとして1980年ごろから始まったBI。その後、「過去に起きた現象の原因を突き止める」ための多次元分析へとステップが進み、ExcelやOLAPといったツールが登場する。さらに、2000年に入ってから始まったのが、経営ダッシュボードという言葉に代表されるモニタリングの動きだ。経営に関する様々な指標をリアルタイムにチェックすることで、「今、ビジネスに何が起きているのか」を知るためのツールが流行した。
そして、今、ブームになりかけているのが「これから、どのようなことが起きるのか」。それを知るための「予測分析」「最適化」の取り組みだ。BIは、過去の分析から始まって、現状の分析、将来の予測へと進んでいる。そして、将来を予測するために必要なのがビッグデータというわけだ。
例えば、Eコマースであれば、「顧客が過去に何を買ったか」はもう理解しており、さらに一歩進んで「これから何を買うのか」を知りたいという願望が出てきている。このようなニーズの変化を受けて、過去・現状を知るための従来型の分析をBusiness Intelligence、将来を知るための取り組みをBusiness Analyticsと区別して、新たなビジネスチャンスにつなげようとする動きもある。「これから何が起きるのかを分析するにあたって、元になるデータが多いに越したことはない。そのためにビッグデータの活用に期待が集まっている」(城田氏)。
今までやってきたことをもっと高性能に行う
ところで、ビッグデータの活用方法には、業界ごとに典型的パターンと呼べるものがある。例えば、インターネットビジネスでは、人間関係を可視化するソーシャルグラフ分析やユーザーの行動解析、小売業界であれば、顧客への商品のレコメンデーションや広告要因分析、リアルタイム需要予測などに利用する例が多い。金融・保険業界であれば、リスク分析、不正取引防止、アルゴリズム取引、通信業界では、顧客離反分析やキャンペーンの最適化などに活用されている。最近では、交通や電力の予測分析を行うスマートシティ分野も有望な活用領域だ。
一見すると、目新しさがないと感じる人もいるかもしれない。実際に、ビッグデータは全く新しい分野に活用することもあるが、これまでの取り組みを強化するという意味合いも強いと城田氏は指摘する。「今まで、分析を諦めてきたデータを対象に加えることで、今までやってきたことをもっと高性能に行う。より高精度の予測が可能になるという意味で、ビッグデータの活用の意義がある」(城田氏)。分析スピードやディスクの容量の問題で破棄していたデータを活用したり、具体的な活用に結びついていなかったソーシャルメディアでの顧客のつぶやきなどを企業のシステムに取り込んだりすることで、よりよい洞察を獲得するのというのもビッグデータ活用の大きな役割だ。