米Databricks製品開発トップに直撃 競合Snowflakeとの違いは「オープンであること」
20億米ドル以上の資産調達済みの同社 IPOはゴールではなく、旅路はまだ始まったばかり

米Databricksは6月下旬、本社のある米国サンフランシスコにて年次イベント「Data + AI Summit 2022」を開催した。同社は「データウェアハウス」と「データレイク」を組み合わせ、いわば良いとこどりをした「レイクハウス」の概念を提唱し、それに準じたサービスを提供している。さらに同社は、そこにAIの機能を掛け合わせることで「データ活用の民主化」を実現しようとしているのだ。今回は、同社 製品開発責任者(SVP, Product)のDavid Meyer氏に話を聞いた。
発表が相次いだ「Data + AI Summit 2022」を振り返る
──まず、Databricksが提供する「レイクハウス・プラットフォーム」の特長を教えてください。システムを使う米国企業の反応はいかがでしょうか。
お客様にとってベストなことは「使い勝手がシンプルで、コストを下げ、かつパフォーマンスが良いもの」だと考えています。データレイクでも機械学習やAI活用には良いのですが、SQLといったデータ分析に関しては苦手とされてきました。一方で、レイクハウス・プラットフォームは、企業がデータやAI用に使っているパブリッククラウド上に構築します。そうすることで、ユーザーは膨大な量のデータを管理することができるようになるのです。

この点は米国のユーザー企業にも大変気に入っていただいています。従来データウェアハウスでは、データアナリストのためにデータを複製する必要がありましたが、それが不要になるからです。言ってしまえば、データウェアハウスそのものを持たなくても大丈夫なようになりました。それに、これらはすべてオープンソースで構築しているので、仮に弊社製品を使わなくなったとしても、レイクハウスを使い続けることも可能にしています。
また、今回の年次イベント「Data + AI Summit 2022」のスポンサーを見ていただくとお分かりのように、Microsoft、AWS(Amazon Web Services)、Google Cloudといった大手クラウドベンダーが名を連ねています。私たちの製品を使うということは、すなわち彼らの製品を使うことにもなるからです。

──御社の製品は機能はもちろんですが、オープンであることも特長の一つですね。今日(取材当時)の基調講演では製品の機能アップデートがいくつも発表されました。製品開発の責任者をされているMeyerさんから、改めて注目の機能を教えていただけますでしょうか。
私が一番ワクワクしているのは、弊社でしか使えなかった機能を含めて「デルタレイク2.0(Delta Lake 2.0)」としてオープンソースにすることです。それがオープンソースのコミュニティなどで使われることで、どのクラウドにもデルタレイクが使われるようになる可能性があることに、とても興奮しています。

そして、特に注目しているのが「データマーケットプレイス(Data Marketplace)」です。デルタシェアリング(Delta Sharing)の上にデルタレイヤーというのがあり、その上にデータマーケットプレイスがあります。データマーケットプレイスでは、データや機械学習のモデルといったものを皆で共有することを可能にしました。

たとえば、日本のユーザーが、米国企業のクラウド上に格納されているオープンデータを使いたいとなった場合、データを動かすことなく使うことができるのです。データだけでなく、データ資産や機械学習のモデル、ノートブック、ダッシュボードといったものも使えるようにしたのは、恐らく弊社が初めてだと思います。そういうことをシステム全体でオープンな形で可能にしています。
この記事は参考になりましたか?
- この記事の著者
-
小山 奨太(編集部)(コヤマ ショウタ)
EnterpriseZine編集部所属。製造小売業の情報システム部門で運用保守、DX推進などを経験。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア