部門や業務ごとに異なるデータを、ひとつのまとまった画面で見るために、データを集約する。古くて新しいこのテーマで、データ統合やデータ連携の様々なアプローチがおこなわれてきた。ここに来て新たに注目されているのが、「データ仮想化」という方法である。ビッグデータ時代の新たなデータ基盤のテクノロジーについて、シスコの久松正和氏に話を聞いた。
急速に注目されつつあるデータ仮想化
「シスコが昨年にデータ仮想化を提唱してから、すでに多くの引き合いが来ていて、現在数10社ほど話を進めています。特に官公庁や大手の企業から、非常に強い関心をいただいています」
こう語るのはサービスイネーブルメントの久松正和氏。IT部門にとって、仮想化といえば、サーバー仮想化やネットワーク仮想化が思い浮かぶだろう。「データ仮想化」は一般にはまだ耳慣れないかもしれない。それは、これまでのデータ統合やデータ連携とはどう違うのか。
「これまでのデータの集約技術とはアーキテクチャが全く異なります。データ統合は、元のデータから物理的にデータをひとつに結合させる。データ連携は、別々のデータソースをつないだり、あわせて別のデータソースを作ったり自由につなぐものものです。データ統合がインテグレーション、データ連携はフェデレーションという概念ですが、データ仮想化はその先の、データアブストラクション(抽象化)という考え方です。元のDBはいじらないで、データがひとつのビューで見えること。従来の方法より、すばやくデータを集約するものです。アブストラクション(データの抽象化)とは、そもそもデータ自体がテーブルベース。ひとつのテーブルの中に、個人情報が含まれる場合、保護対象になる。このテーブルにコンタクトするのには制限が生じる。抽象化とは、ここから必要なカラムだけ引き出し、元のテーブルとは構成の違うテーブルを作る。用途別のテーブルビューを作ることができます」(久松氏)
データ仮想化は、活用とガバナンスを共に追求できる
データ仮想化には以下の様なメリットがある。
- 大量のデータにダイレクトアクセス リアルタイムにすべてのデータにアクセスすることができる。
- データ利用までのスピード 分析要望に対して即座に分析を開始できる。
- 多様な要望に応える プログラミング不要で低コスト・多種類の データセットを生産できる。
これによって、現場で、あらゆるデータを用いた分析が可能となる。1チームでの成功事例をもとに、チームごとにデータセットをカスタマイズするなど、データのガバナンスを効かせた上で、現場での利用を促進できる。
たとえばコールセンター、オンラインショッピングで、会員番号、氏名、電話番号などの個人情報ははずして、売れたものと売れた時間だけを収集すれば、扱いやすい情報になる。従来も、DWHのプロセスでおこなわれてきたが、データマートを作るなど、複雑で時間もかかった。データ仮想化の場合、元のDBから引き出してビュー作る段階で抽象化をかけてしまえば、たとえば個人情報が含まれるようなデータと、オーダーの情報だけのデータと、メタな環境で分けてハンドリングできる。
重要な取引データや個人情報を含んだ顧客データそのものをいじることなく、ビジネスの現場のユーザーが、それぞれのデータを自分たち自身で組み合わせて、分析や参照をおこなう。このことのニーズは、非常に高まっている。
データ仮想化のベストプラクティスを提供
データ仮想化が非常に期待されている分野は、大規模な統合や合併がおこなわれた企業や、公共機関などである。たとえば、合併後の金融機関では、合併前の数社の別々のデータソースを、早急にひとつにまとめなければいけない。経営上のニーズからも、従来のデータ統合のような数ヶ月を要するような方法では間に合わない。またビッグデータ分析においても、従来のように、別々のデータをひとつのデータマートにするなどの方法では、現実のビジネスにスピードに追いつくことはできないからだ。
データ仮想化を活用するにあたっては、データを仮想ビューによるレイヤーで整理し、それぞれのレイヤーごとに抽象化することでガバナンスと開発効率の向上を実現する。この活用方法をデータ利用の「ベストプラクティス」としてまとめ、データ仮想化ソリューションと共に提供している。
データの管理領域を、LOB(業務部門)とCDO(データ管理責任者)とIT部門の、レイヤーとして分けることで、これまで煩雑になりがちな課題も、格段に効率化が向上すると久松氏は語る。
「たとえばデータのクレンジングに関して言えば、データの形式や型などは物理的なレイヤーで標準化を完了させてしまいます。今まではすべてのレイヤーでクレンジングするなど、煩雑になっていました。基本的に物理レイヤーで標準化のスクリプトを組んで、元のDBで合わせてしまいます。あとは、顧客情報や商品の情報を、見たいビジネスユーザーごとに権限を分けて、アプリケーションごとに動作が出来るようにさせる。基盤の方は、IT部門がデータのクレンジングをおこない、中間のレイヤーでは、CDOが、データのガバナンスを効かせながら、必要なコンポーネントごとにデータをとりまとめて、LOBにどう配るのかの方針を決める。そして、ビジネスユーザーやLOBが、自分たちでビューを作って活用する。これが、データの抽象化によるプラクティスです」(久松氏)
シスコが、バークレイ銀行やコムキャストなどの欧米の大手企業と一緒に作ってきたモデルだ。これをベストプラクティスとしてまとめて、日本の顧客向けにトレーニングサービスをおこなうという。
シスコは、今回このデータ仮想化の普及のために、詳細な解説書の翻訳をおこなった。AmazonのKindleストアで購入できる。関心のある人にはぜひ読んでいただきたいと久松氏は語った。
- 書名 : 『データ仮想化』(Amazon Kindle 電子書籍版)
- 発行 : 翔泳社
- 著者・監修:シスコシステムズ合同会社
- 定価 : 500円(税別)
- 購入方法 : Amazonでの購入はこちら