得意分野はデータの統合、RDBMSよりも圧倒的に安価
米マークロジックのCEO兼プレジデントのゲーリー・ブルーム氏は、MarkLogicの製品を次世代のデータベースだと語る。得意なのは様々なデータの統合であり、官公庁を含むあらゆる業界の大手企業で数多くの実績を持つ。MarkLogicが大企業に支持されている主な理由に、新しいNoSQLのデータベースでありながらエンタープライズ用途に必要な高い可用性、拡張性が挙げられる。その上で、本来NoSQLデータベースが備えている高い柔軟性を併せ持つ。
「MarkLogicは、企業のデジタル・トランスフォーメーションのプラットフォームとして採用され、ユニファイドビュー(360度ビュー)の機能を提供しています。加えてトランザクションシステムとしても利用でき、データを様々な角度から見られるだけでなくオペレーショナルなシステムのエンジンとしても利用できるのです」
例えば、IoTから生まれるデータや顧客の行動に関する様々なデータなどを、MarkLogicで1つに統合できる。現状IoTなどを活用し新たなビジネス価値を見出そうとすると、データが分断していてなかなか上手くいかない。その課題を解決できるのが、MarkLogicだとブルーム氏は説明する。
様々なデータソースのデータを集める場合には、ETL(Extract、Transform、Load)の仕組みが使われることが多い。これは集める先のリレーショナルデータベースが柔軟にデータを扱えないためで、ETLでリレーショナルデータベースに格納しやすいようデータを加工する。ETLを使いデータの変換はできるが、それで新たにリレーショナルデータベースが柔軟性を持つ訳ではない。集めたデータを様々なアプリケーションで利用するために取り出そうとすれば、効率を考えアプリケーションごとにデータの複製を作ることもある。「これではデータのセキュリティも確保できず、データ全体の管理効率も悪くなってしまいます」とブルーム氏は指摘する。
対してMarkLogicはデータベース自体に柔軟性があるので、ETLで変換する必要はない。「as isでデータを入れることができ、事前準備や変換は必要ありません」とブルーム氏。またデータを使う際にも、アプリケーションの要求に合わせ柔軟な形でデータを提供できる。このデータの取り出しやすさに寄与しているのが、ユニバーサル・インデックスと呼ばれるもので「これはGoogleの検索の仕組みと似たようなものです」と説明する。
ユニバーサル・インデックスはデータの更新があっても、再構築する必要はない。これらはリレーショナルデータベースとは大きく異なるところだ。MarkLogicの特長は、データ統合におけるこうした新しいアプローチだという。また、データを扱う上での柔軟性の高さは、機械学習などにも有効だ。
「機械学習で大量なデータを扱う環境を開発する期間も短くて済み、リレーショナルデータベースでデータを統合するよりも圧倒的に安価です」