データ管理の重要性
――企業の中にバラバラに存在している色々なデータソースを、あたかも一つのデータベースのように見せたい、一つのデータベースのように扱いたいというのがデータ仮想化ですね。
諸橋氏 はい。あらかじめデータ仮想化製品に設定することによって、どこにどうログインするかということをその管理者が決めてしまえば、データを使う人たちは、どこにあるのか意識しなくていいです。
河野氏 データを有効活用する前に、どのシステムにどういうデータがあるのかということを、システムを横断して把握している人は、まだいない状態だと思います。したがって、データベースを管理するという考え方から、データ自体を管理していく、そういう役割を持つ人を置いて運用していくことが今後重要になってくると思います。
諸橋氏 まずはデータのありかとそれがどんなデータなのかをしっかり把握する活動をされている方が多いと思います。抽象度を上げて、「どこにあるのです」、「こうやって管理しているのです」ということを定義して情報としてきちんと持っているデータ仮想化製品ではビューをER図で見ることができます。ドキュメントとして残そうと思っているものが常に利用するデータベースの中にあるような形になります。
高橋氏 その点はデータ仮想化製品の強みだと思います。データの利用を促進するためには、データモデルの管理を容易にできるということは重要だと思います。また、実際にデータを利用する際には、データモデルが階層的になることが多いのですが、そのような階層的なモデルの管理もGUIで行うことができます。
河野氏 同じお客様情報でも利用するシステムによって必要な情報は異なりますが、あるシステムは単純に名前と住所だけでいい。あるところは名前と、やはり属性情報が欲しい。そういった要望にも「利用モデル」を変えるだけで対応できます。データの標準構造であるデータモデルと利用者に合わせたデータモデルを階層的に定義できるのです。
諸橋氏 データソースのシステムから、ビューを分離できるという言い方もできると思います。ビューをデータソースに持ってしまうと、構造が複雑になります。ビューがデータモデルとしてデータ仮想化製品側にあると、階層的になる部分はデータ仮想化製品内で処理させるという感覚で分離ができます。そして、分離することによって、データソースのシステムに負荷をかけづらい形にもできます。
もちろん、誰かがそのデータモデルを考えなければいけません。それぞれが分離することによって、各システムに求められる要件が整理でき、データソースの管理者はデータベース管理システムの管理に、データ仮想化製品の管理者はデータモデルの管理に、専念できます。その結果として、データの利用者は、よりそこにあるデータを扱うことに専念できるようになります。
――データ管理が、よりデータ自体を管理していくことになるのですね。後編では、データ仮想化の代表的な製品である「Red Hat JBoss Data Virtualization(JDV)」の強みや用途、企業の事例や導入のポイントなどについて迫っていきます。(後編に続く)
データ統合の各種技術とデータ仮想化を実現するRed Hat JBoss Data Virtualizationとは?
インメモリデータベースや列指向データベース。また、HadoopやNoSQL製品等の登場で大量のデータが蓄積されるようになりました。このようにさまざまなデータを活用する必要がある中で、データ統合の手法として近年特に注目されているのが「データ仮想化」です。
本テクニカルペーパーではデータ統合の各種技術とそれらが解決する課題領域を解説し、「データ仮想化」を実現する製品である「Red Hat JBoss Data Virtualization」を紹介します。本資料はデータ統合の課題を解決したい方に向けた資料です。
実際にデータ統合の際にどこから手をつければよいかわかり、またデータ統合のポイントも知ることができます。