MapRのコンバージェンスではデータの場所を気にする必要がない
この「1点に集中する」という意味が込められているのがMapRの製品と語るのは、マップアール・テクノロジーズのシニアデータエンジニア 草薙昭彦氏だ。デジタル化が進んだ企業では、データの分析と業務のオペレーションを上手く結びつけている。自社でそれを実現できておらず他社が実践していれば、市場競争に敗れてしまう。つまりデジタル・トランスフォーメーション時代においては、競争力を得るにはデータ活用が肝になると草薙氏は指摘する。
ところで現状ではさまざまなシステムが企業にはあり、データを活用しようとするとそれぞれのシステムからデータを移動させなければならない。データの移動は、集めたデータを賢く分析するよりもかなり困難を伴う。データを移動させる取り組みは、かつてEAIやSOAといったキーワードでも実現しようとしてきた。現在のビッグデータの時代においてもこの課題は変わらない訳だ。
なぜデータを移動しなければならないのか。その理由は「分析とオペレーションを別々に行っているからです」と草薙氏。これに対しMapRのコンバージェンスのアプローチは、1点に集めることで分析とオペレーションのシステム間のデータ遅延などをなくし、リアルタイムにデータ活用ができるようにするものだ。これはデータを移動させるのではなく、オペレーションを行う各システムのデータを最初からMapRの分散ファイルシステムに置くことで自動的に1カ所に集まることになる。
草薙氏によれば、インテグレーションとコンバージェンスは違うという。インテグレーションは統合と訳され、こちらはバラバラだったシステムを1つにするもの。大規模データウェアハウスのようなものが、その典型だろう。一方でのコンバージェンスのアプローチでは、「Converged Data Platform」というデータレイヤを設ける。この部分は統合のために大規模サーバーを用意するような、ハードウェアの選択からは独立している。さらに、オンプレミスかクラウドかといったインフラの選択からも独立する。
Converged Data Platformは、MapRを共通の分散ストレージとしてERPなどの既存のエンタープライズアプリケーション、ビッグデータ分析アプリケーション、さらに次世代のインテリジェントアプリケーションからデータを扱えるプラットフォームとなる。オンプレミスでもクラウドでも、データを物理的なインフラにとらわれずに格納できる。またバッチ処理もインタラクティブなデータ分析も、さらには遅延のないリアルタイムな処理も可能で、これらを複数組み合わせて走らせることもできる。その際に、アプリケーション側では、データの場所を気にする必要もない。
このConverged Data Platformの核となるのが「MapR-XD」だ。これを利用することで、アプリケーションからはデータは統合化された1つのものとして見えるようになる。MapRでは、拡張性のある分散データ基盤で業界標準のオープンなインターフェイスを使ってそれにアクセスできるようにしている。これは、MapRが創業以来イノベーションとして続けていることでもある。
このプラットフォームの利点の部分は、MapRが一方的に主張しているわけではない。すでに多くの企業がこのメリットを享受している。たとえばSAPでは、MapRのプラットフォームを自社クラウド基盤のストレージとして採用している。「IBMのSpectrum Scale(旧GPFS: General Parallel File System)とさまざまな観点から比較、検証し、MapRをファイルシステムとして採用しています」と草薙氏。MapRにしたことで、既存システムとの比較で3から4倍のI/O性能を発揮し、信頼性、耐障害性、自動フェイルオーバー、レプリケーション、スナップショット、ミラーリング、マルチテナントセキュリティといった多くの要件を満たすものだと判断されたと説明する。
さらに、「MapR Edge」という小規模なクラスターの仕組みも2017年春からMapRでは提供している。これはデータが発生源の近くで、ある程度の処理をしてしまうためのものだ。これでIoTなどにおける、エッジ側でも処理したいというニーズに応えることになる。MapR Edgeは最低3台の構成から利用できる。中身自体は、従来のMapRと変わらず、利用用途を明確化しそれに合わせ利用しやすい柔軟なライセンス体系を用意したものとなっている。