Shoeisha Technology Media

EnterpriseZine(エンタープライズジン)

EnterpriseZine(エンタープライズジン)

テーマ別に探す

ビッグデータと既存データを統合したエンタープライズ基盤の構築を - 日本テラデータ 金井氏

2012/02/21 18:00

 ビッグデータはすでにバズワードではない。爆発的に増大するデータ、それもこれまでは分析対象にならなかった新しいタイプの膨大な非構造化データをビジネスに使わない手はない - 1月23日、東京・ベルサール九段で開催された「IT Initiative Day 2012 ビッグデータ時代のビジネス戦略」において、日本テラデータ コーポレート・エバンジェリスト/エグゼクティブ・コンサルタント 金井啓一氏はこう断言した。かつてない量のデータ、そしてかつて見たことがないタイプのデータに、日本企業はどう向きあうべきなのか。本稿では、日本のDWH草創期からデータ分析をビジネスに活かす戦略を説き続けてきた金井氏によるセッション「ビッグデータを取り込む~そのビジネス活用戦略と最新動向」の内容を紹介していきたい。

"ビッグデータ"と従来のデータの違いとは

日本テラデータ
コーポレート・エバンジェリスト/エグゼクティブ・コンサルタント
金井啓一氏
日本テラデータ コーポレート・エバンジェリスト/エグゼクティブ・コンサルタント 金井啓一氏

 金井氏はまず、これまでの分析は「過去データの取り込み」、つまり出荷や販売、購買などの取引結果をDWHに取り込んで行う分析が主だったとする。だが経営のスピード化が進む現代においては、これらの過去データに頼った予測やアクションだけでは、インサイトを引き出し、新しい価値を顧客に提供していくことは難しいという。取引には記録されないデータ、たとえばWebログデータ、レシートデータ、トレーサビリティデータ、さらにはソーシャルデータ、モバイルデータ、センサーデータなど、これまで"未活用データ"としてDWHに取り込まれずにいた新しいタイプのデータを積極的に活用していくべきと金井氏は提案する。

 こうした未活用データはいわゆる非構造化データが多く、ひと括りに"ビッグデータ"と呼ばれることも多いのだが、金井氏はビッグデータという言葉を以下のように定義している。

-------

 許容可能な経過時間内で、通常利用しているツールを利用して、データの収集・管理・処理することのできる能力を越えるデータのこと。サイズは、常に変化しており、1つのデータセットで、10テラバイト程度から数10ペタバイトにまで及ぶ。

-------

 つまりWebログやソーシャルデータ、センサーデータといった非構造化データはもちろん、「SQLで発行してRDBMSで管理するような構造化データもビッグデータに含まれる」と金井氏は言う。ビッグデータの定義はベンダや識者によって異なることが多いが、長年に渡って世界のトップ企業にDWHポートフォリオを届けてきたテラデータならではのビッグデータへの見解として参考になる。

ビッグデータ活用への市場の期待と取るべき戦略

 IDCによれば、「2020年までには世界中のデジタル情報の量は44倍まで増加し、想像も及ばない35ゼタバイト近くにまで達する」という。まさしくビッグデータ時代の到来である。そして、現在、世界中のデジタルユーザがソーシャルネットワークを介して網の目のようにつながり、ソーシャルグラフを形成している。1人のユーザが発した情報はあっという間に伝播し、いまこの瞬間においても膨大な量の情報 - ビッグデータが世界中をかけめぐっているのである。

 また、企業においても"データのビッグデータ化"は着実に始まっていると金井氏は言う。多くの業界で明細データの量が急増、数百テラバイトから、企業によっては数十ペタバイトにも上る。たとえばeコマースではクリックストリームやWebログが、製造業ではマシンデータやセンサーデータが急増している。これらのビッグデータから知見(インサイト)を導き出し、その知見を活用して収益につなげること、すなわちビッグデータに適切に対応するための新しい戦略がいま、企業には求められている。

 ビッグデータに適切に対応するための戦略とは何を指すのか。金井氏は大きく以下の3つが重要だと説明する。

 1. 新顧客戦略 … 最も重要なのはビッグデータでもソーシャルメディアでもなく顧客。データやSNSの向こうにいる顧客を正しく理解するため、複数の顧客識別子(既存チャネル、Webサイト、ソーシャルメディアなどで発生する購買顧客のID、メールアドレスなど)を統合する必要がある。データの統合なしで顧客の理解は無理

 2. 新マーケティング戦略 … 従来までの"企業と人"の関係ではなく、これからは"人と人"の関係が重要になる。Webログやソーシャルメディアの分析から関係性の強弱を見据え、マスと個の両面からアクションを取る

 3. 品質管理/顧客サービス … 生産ラインや製品使用中に発生するリアルタイムのセンサーデータと既存データベースを統合して、事故や故障の予測や品質改善、盗難防止サービス、料金の適正化などに活かす


著者プロフィール

  • 五味明子(ゴミ アキコ)

    IT系出版社で編集者としてキャリアを積んだのち、2011年からフリーランスライターとして活動中。フィールドワークはオープンソース、クラウドコンピューティング、データアナリティクスなどエンタープライズITが中心で海外カンファレンスの取材が多い。 Twitter(@g3akk)やFacebook(...

バックナンバー

連載:IT Initiative Day

もっと読む

All contents copyright © 2007-2019 Shoeisha Co., Ltd. All rights reserved. ver.1.5