データ仮想化の価値
――仮想的なデータ統合の具体的な事例やユースケースを教えていただけますか。
河野氏 例えば金融業の例だと、多数のシステムにまたがったお客様情報を仮想的にまとめ、案件情報と仮想的に統合してBIツールを利用して参照する利用例があります。今までは利用者が独自にデータを取得していたのですが、人により取得するデータが異なっていました。データ項目が大量であるので、利用目的に合わせた正しいデータとの考え方は無く人依存のレポートになっていたのです。これが仮想的なデータ統合により正しいデータを皆が共通に簡単に扱えるようになりました。他には、製造業の事例で、拠点のデータ統合処理を仮想化で実現した事例があります。今までは大量のデータベースバッチ処理をスケジューラで実行していたのですが、中間テーブルが大量にできて管理が難しく、最終的に利用するテーブルの構造や、取り込むデータのシステムが変更になった際に、処理の見直しから始めて非常に時間がかかっていたと言います。これが、仮想的なデータ統合になれば中間テーブルが不要になるため、どのデータをどこから取ってきているのかが一目瞭然となり、修正の工数が大幅に減りました。
――なるほど、ではデータ仮想化の価値はどのようなものがあるのでしょうか?
河野氏 まずはデータ活用までのスピード向上が挙げられます。今までのデータウェアハウスは、導入設計段階でデータモデルの正規化を行わなければなりません。当然ながらシステム構成もはじめから決めなくてはいけません。そこで膨大なお金と時間がかかります。データを統合するために各部署との調整も労力がかかります。それが仮想であれば、「必要なデータモデル」をまずは定義し、それに必要なデータ統合処理を作成すればすぐに利用が可能となります。今までのようにハードウェアを準備するために時間をかけてサイジングをする必要もありません。
諸橋氏 物理的なデータ統合をやろうとしたら、ETLのツールが新しいシステムに対応できなくて困るとか、昔のソフトウェアをそのまま使わなくてはいけないとかいった制約があったりします。このように、お客様が抱える課題や制約が色々とあるなかで、最終的にデータ仮想化を入れてみようとされるケースはあります。
――データが見える化できると、ビジネスのアジリティが上がるという言い方がありますよね。これは具体的に言うとどういったことなのでしょうか。
河野氏 「そのデータって、本当に正しかったの?」となった時に、データウェアハウスやETLの場合だと、そのデータを作る仕組みを全部見直さないといけないですね。このデータはどこから取ってきたのか、どういう取り方をしたのか、そこで、一つの項目を変えたくても、そのために一、二ヶ月かってしまう。それが、仮想化であれば依存関係が図式化されるので、どこからどう取ってきたかをすぐに判断ができるようになります。
諸橋氏 データの見える化だけではなく、データのフローが見える化できるようになります。ビューの定義はSQL文です。どこのデータソースの何を持ってきているのか、データ仮想化製品の管理者は分かるわけです。
――たとえば、今までまったく取り組んでこなかったデータ項目を追加するというのは、具体的にどのくらいかかるものなのでしょうか。
河野氏 どこから取るかにもよりますが、データベース、ファイル、Webサービス等であれば、SQLのビューという形で項目を追加できますので、通常は一日あれば利用できるようになります。
――確かにビジネスのアジリティは劇的に変化しそうですね。
河野氏 データ仮想化によって、元のデータソースは利用者から隠蔽されます。データソースが何であってもかまいません。そのため、たとえば今はAというデータベースを使っているけど、費用面や性能面でBというデータベースに置き換えたいといった場合でも、利用者は意識せずに変更することが可能になります。
――データ仮想化のような仕組みがない場合は、データベースを入れ換えると、アプリケーションも全部手が入るので、大事になってしまう。データ仮想化によって、統廃合するDBの移行などに適切に判断できる時間が増えるたりするのも大きなメリットですね。
河野氏 そうですね。他のシステムに影響を与えることなく変更が検討できるようになるので、その分、リスクを抑えて低コストの統廃合ができるのではないかと思います。統廃合といえば、メインフレームでもそうですが、「全部まとめて一括で移行」なんていうのは決してできなくて、やはりシステム毎に個別の移行になります。通常、システムは新旧共存することになります。システムの移行は、個別でアプリケーションを変えるのでいいのですが、「新旧のデータを一緒に活用したい」と考えた時、かなり大変なことになります。その場合、仮想レイヤーを設けることによって、あるタイミングでは昔のデータを見ていて、あるタイミングでは新しいデータを見にいきます、ということをすると、実は全く意識することなく今まで通りデータを使える、ということが可能になります。
諸橋氏 たとえば「表がそこにある」と捉えていると、ときに必要もないのに全件取得してしまって、それだけでシステムに負荷を与えることにつながったりします。「こっちは移行でピリピリしているのに!」みたいな話になりがちなのです。「そういったことを考えなくてもいいように、こういうツールを入れますよ」とか「この役割を責任持ってやりますから、もう平行して進めちゃってください」と言いやすくなると思います。
そういうことが会社の中で、システムとして次々に持ち上がるわけですね。そのたびにツールを変えたり役割を変えたりするぐらいだったら、全社のデータを管理する専任者が行ったり、データ仮想化製品のような専用のソフトウェアを使って行う方が、標準化やモデリングみたいなことも含めて有用だと思います。
高橋氏 ITRの調査データによると、IT予算があまり伸びていない状況のようです。特に新規の投資比率というのが、IT予算の中で、どちらかというと低下しているという評価があります。つまり、新しいことにかけられるお金はそんなに増えていない。このような状況のなかで、データも多様化し、ITでやりたいことは増えてきています。それなのに予算が増えていないので、どうしても昔より効率の良いITの導入ということが求められている。色々な部門で差があると思いますが、根本にはそういう状況だと思います。
河野氏 その他の価値としては情報セキュリティの強化もあります。たとえば個々のデータベースは当然セキュリティ設定がされていますが、複数のデータベースを扱う場合や、ファイルやWebサービスは、システムのセキュリティがそれぞれ別々なので、データを取ろうとするとユーザーIDやパスワードを使い回すことがよくあります。これを仮想的なデータ統合でセキュリティを統合的に扱い、監査証跡を設けることで強化することが可能になります。
データ統合の各種技術とデータ仮想化を実現するRed Hat JBoss Data Virtualizationとは?
インメモリデータベースや列指向データベース。また、HadoopやNoSQL製品等の登場で大量のデータが蓄積されるようになりました。このようにさまざまなデータを活用する必要がある中で、データ統合の手法として近年特に注目されているのが「データ仮想化」です。
本テクニカルペーパーではデータ統合の各種技術とそれらが解決する課題領域を解説し、「データ仮想化」を実現する製品である「Red Hat JBoss Data Virtualization」を紹介します。本資料はデータ統合の課題を解決したい方に向けた資料です。
実際にデータ統合の際にどこから手をつければよいかわかり、またデータ統合のポイントも知ることができます。