データ活用がビジネスと直結
バークレイズ銀行は、債権のトレーディングで取引がどのくらいのリスクがあるかを分析し引当金の額を決めている。アルゴリズムを使ってリスクをどれだけ正確に予測できるかがカギになる。それによって引当金の額が変わり、収益に直結するからだという。そこで、リスク分析のアルゴリズムをより正確なものにするために、分析に使うデータを拡充することにした。
従来はOracle Exadataに最新30日分4億レコードのデータを格納していた。30日を過ぎた分は、過去5年分をテープに保存しオフラインで管理し、アルゴリズム作成のためには使用していなかった。そこで、まず、テープに保存していた5年分の過去データをHadoop基盤に移行して、即座にアクセスできるようにした。次に、ExadataとHadoopの上にデータ仮想化レイヤーを導入し、データを統合化して分析できる基盤を作った。
「SQLでExadataとHadoopのデータの両方にアクセスできるようになったことがポイントだ。バークレイズのアナリストは特別な技術を習得する必要もなく、テープによるバックアップコストとHadoopの構築コストがほぼ同等だったことから追加コストも発生しなかった。リスク計算の精度がかなりよくなったことを受け、さらに、マーケット情報、オンラインデータ、クレジットカード情報など89種類のデータソースを追加した。これにより、売上に占める引当金を最適化し、収益を改善できた」
コムキャストでは、約4000万人の顧客に対して様々な新サービスを提供している。このサービスを顧客に推奨するための分析にデータ仮想化を応用した。複数の会社を買収して成立した巨大企業であるため、個々のサービスはサイロ化された運用になっており、顧客のデータが複数のシステムに分散されていたが、データ仮想化によって、これらを統合化して、顧客をより理解し、一人あたりの収益性を向上させることを目指した。
データソースとしては、顧客の課金情報やコールセンターへの問い合わせ履歴、質問項目、トラブルの内容、ECサイトでのクリックストリームデータ、コンテンツの購入履歴、CMのスキップデータ、試聴データなど。このほか、サードパーティが行った顧客調査のデータや人口動態データなど、あわせるとデータソースは20以上になったという。
「コムキャストの場合、データソースは、クラウド上と社内オンプレミスであったり、形式もさまざま異なっていた。そこで、これらを仮想化レイヤですべて統合してマーケットデータを扱う論理的なDWHを構築した。構築はわずか3ヵ月で完了し、このDWHを使ってOne to Oneのマーケティグを展開したところ、新サービスの採用率が5~6倍向上した。最終的に売上高を2100万ドル押し上げる効果が得られた。このプロジェクトの初年のROIは10倍に達した」
セッションの最後に紹介した石油会社のケースは、油井から送られてくる、圧力や温度、流量などのテレメトリデータから故障などを予測し、部材調達を最適化している取り組みだ。もともと、個々の油井のテレメトリデータをサンプリングしそれぞれで予測を立てていたが、精度がよくなかった。
そこで、油井それぞれのデータをデータ仮想化レイヤで統合し、統一的なデータとして分析を行うことにした。さらに、財務データやサプライヤーのデータなど、45以上のデータソースを統合。サプライチェーン全体で最適化を図っていった。
「従来の手法とくらべて50%のコスト削減になり、年間では200万ドルのコストセーブを実現した。また、シングルソース化したことで、マネジメントから新しい質問が出たときなどは、3倍速く回答できるようになった」
Breissinger氏は最後に、データ仮想化の利点として、データに直接アクセスできるため経営へのインパクトが大きいこと、常に最新のデータを使うことができるためビジネスに俊敏性が得られること、既存資産をそのまま利用でき、不要なデータマートとそれを実現する大量のハードウェアを削減できるためコスト削減につながることを説明。IoE時代に適したデータ分析基盤構築のアプローチであることを強調した。