発表にあたり、日本オラクルの代表執行役社長 兼 CEOの杉原博茂氏は、「オラクルでは、いろいろなモノがクラウドでつながり、データ利用が爆発的に増える社会をModern Cyber Societyと呼んでいる。クラウド時代はビッグデータ活用が企業の生命線になる。新製品で、Modern Cyber Societyの新たなビジネス価値創出を実現する。ビッグデータ市場でNo.1を獲得したい」と、新製品の位置づけを説明した。
製品紹介を行った専務執行役員データベース事業統括 三澤智光氏によると、Oracle Big Data SQLは「ひとことで言うと、Oracleが取り扱ってきたリレーショナルなファイルシステムの配下にNoSQL、Hadoopのファイルシステムを置き、構造化データと非構造化データのカベを取り払って一元管理できるようにしたもの」だ。
ポイントは大きく4つあるという。1つは、これまでOracle Databaseが行ってきたXML、JSON対応に続いて、あらたにHadoopのファイルシステムであるHDFSに対応し、SQLですべてを活用できるようにしたこと。2つめは、構造化、非構造化データを透過的に分析できるようにしたことで超大規模DWHの構築が可能になったこと。3つめは、ビッグデータ環境へオラクルの堅牢なセキュリティをそのまま適用できること。4つめは、Exadataで培われた高速化機能を搭載していること。
三澤氏によると、これらのポイントは、同社がビッグデータのソリューションを顧客に提供するなかで課題になってきたことを解決することを目指したものだ。
欧州のある大手金融機関では、顧客属性(デモグラフィック)と購買履歴を組み合わせた送客プログラムをリアルタイムで実施するために、オラクルのビッグデータソリューションを利用している。同行では、決済端末から顧客の位置を即時判定し、地理軸、時間軸、オファーのモデルをもとに、店舗で利用できるクーポンをSMSで発行。そのうえで、送客と購買誘導ができたかをカード決済ログから判定して、プログラムの精度改善につなげている。
「こうしたビッグデータを使ったリアルタイムのオファーでは、オファーのタイミングや精度が重要だ。同じオファーを同じ顧客に何度も送ったり、顧客が利用できないタイミングでクーポンを発行したりでは、ジャンクメールと変わらなくなる。そんななか、この金融機関で課題になったのは、さまざまな種類のデータをリアルタイムに扱うためにどう一元化するか、開発・運用・保守スキルの不足をどう補うか、個人情報をどう適切に取り扱うかなどだった」(三澤氏)
一般的にも、ビッグデータ活用で障壁となるのは、既存のDWHとHadoopなどの新しいシステム、センサなどの新しい機器から得られるデータなどのインテグレーションが複雑になること、多大なデータの準備やスキルの育成が難しいこと、セキュリティガバナンスへの対応が難しいことなどだという。そうした課題に対し、Oracle Big Data SQLでは、「すべてのデータにシンプルにアクセスできるようになり、ビッグデータ分析をさらに迅速に行うことができ、すべてのデータに洗練されたセキュリティを提供できる」(三澤氏)という。
具体的なテクノロジーについては、Hadoopシステムの統合方法が競合他社と異なる点、高速な検索を実現するExadataのSmart ScanをHadoop側に適用できる点、データベースそのものにそなわるユーザー管理や権限コントロール、アクセス制限を利用できる点を紹介した。
Hadoopシステムの統合方法の競合他社との違いとしては、他社がRDBMSとHadoopを並列するかたちでフェデレーションエンジンの配下に置く「フェデレーション型」であるのに対し、DBサーバの配下にHadoopを置く「データベース統合型」だと説明した。フェデレーション型はすべてのSQLが使えるわけではなく、アプリの改修が必要になる場合がある。また、セキュリティもHadoop側の実装に依存する。これに対し、データベース統合型では、オラクルのすべてのSQLがアプリの改修なく利用できる。また、atabaseなどで培った高速クエリ技術をHadoopに実装することができるようになるほか、データベースに備わる強固なセキュリティをそのまま継承することができる。
Smart Scanテクノロジーは、Databaseサーバの処理の一部をストレージとなるExadata側で行うことで、ストレージからDatabaseに返すデータを大幅に削減できるようにしたもの。このSmart ScanをHadoop側(HDFS)に蓄積された膨大なデータに対しても適用できるようにした。HDFSからのデータの移動が最小限に抑えられ、パフォーマンス向上とマシンリソースの有効活用が可能になるという。
セキュリティについては、データベースの管理をDBAに集中させるのではなく、データの利用者、DBA、セキュリティ管理者のそれぞれの業務に応じて職務分掌を実現し、高度なアクセス制御を実現することができる機能をHadoop環境にも適用できることを説明した。また、既存のセキュリティ・ポリシーはすべてのデータに適用可能なほか、Oracle Big Data Applianceが持つ、認証、認可、暗号化、監査の機能を組み合わせることで、データへのガバナンス強化プロセスを簡略化できるという。
「ビッグデータの取り組みに先進的な企業であっても、工数をかけてデータを加工し、データベースにデータを移動して活用しているのが現状だ。今後は、構造化データと非構造化データを高度に融合した新たなビッグデータ分析基盤により、データを直接分析できるようにしていく」(三澤氏)