OracleのBig data戦略とは?
「Oracle Database 11g R2のリリース以降、特にExadataをリリースしてからは、今でいうBig Dataの活用を見据えたデータベースを検討しているお客様からの問い合わせを受けるようになりました」
日本オラクル テクノロジー製品事業統括本部 データベースビジネス推進本部 製品推進部 部長の人見尊志氏は、Oracleにおいても市場でBig dataに対するニーズが高まっている認識があると言う。
「現時点でもオラクルは、Big Dataを活用するためのテクノロジーをリリースしています。今後のオラクルのBig Dataに対する取り組みについては、米国本社 データウェアハウス製品開発のプロダクト・マネージャ・チームのブログ(The Data Warehouse Insider )を見ていただけると理解いただけると思います」(人見氏)
膨大な量と種類を高速で扱う必要性となるBig Dataへの対応においては、それらを支えるためのプラットフォームが必要になる。いわゆる次世代のBig Dataコンピューティング・プラットフォームにおいては、データから深い洞察を生むことができる分析機能や異なるデータ種類を整理すること、プライベー ト・クラウドのようにIT基盤としての柔軟性や経済合理性が求められ、そして何より高いセキュリティを敷くことが可能である事が求められるわけだ。
「MapReduceによりBig Data処理の並列化を行うという領域に対しても、Oracle Databaseが提供しているPipeline Table Functionを活用することで、データベースの並列処理機構を活用する事が十分に可能です。ちなみに、2009年にはこのような活用方法についてもいち早くWhite Paperが執筆されています」(人見氏)
たとえば、製造業が利用しているMES(Manufacturing Execution System:製造実行システム)などからは、製造ラインの状況を示すさまざまなデータが次々と発生する。これらデータを、分析し活用したいというニーズがあるとしよう。得られるデータは、各種センサーからのストリームデータのようなもので、製造ラインが稼働すれば次々とデータが発生する。このデータを用いて製造製品のトレースを行いたい場合には、データの信頼性や整合性が損なわれてはならない。
つまり、「今後はBig dataといえども、よりミッションクリティカルに扱うべきデータが出てくる」と人見氏は指摘する。
一方で、データマイニングなど高度な分析を行おうとする場合、データを構造化しないと難しい面もある。どのデータをどのようなデータベースに格納して分析を行えばいいのか。
「データを置く場所と処理する場所を分けて考えたいという顧客も出てきている」(人見氏)
「処理するためのデータはたとえばHadoop Distributed File Systemにあってもよいわけですが、ポイントは、それら分散されたデータを高速の整理、変換ができるかということにデータ活用の真髄があると考えています。そのためのデータアクセス方法についても、すでに多くの議論と実装に向けての研究が行われています」(人見氏)
アプリケーション側からはデータがNoSQLに格納されているのか、RDBMSに格納されているのかは、できれば考慮したくない。ユーザーは、どちらに格納されていようとも、目的の処理を素早く正確に行いたいだけだからだ。
「現時点でもOracleには、NoSQLデータベース的に利用できる技術として、Berkeley DBは組み込みDBとしてもKVSとしてもポピュラーであるし、Complex Event Processingなどを必要とするM2M(Machine To Machine)などの領域においてはCoherenceを含むインメモリ・データグリッドのテクノロジーも適用が進んでいる」(人見氏)
OracleにはAutomatic Storage Managementによるストレージグリッド技術やOracle ASM Cluster File Systemといったクラスタ・ファイルシステムも持っており、NoSQL、Big Dataを扱うにおいて、Hadoop MapReduceやHadoop Distributed Fil Systemだけが最適解という訳ではないことが十分にうかがえる。
「Big DataやNoSQLの領域に関心のある方はぜひ、今秋サンフランシスコで開催されるOracleOpenWorldにお越しいただき、オラクルの最新テクノロジーを体感していただきたい」(人見氏)