データブリックスが提供するレイクハウス・プラットフォームとは?
――データブリックスがどんな会社なのか。概要の紹介からお願いします。
竹内:データエンジニアやデータサイエンティストのための統合型データ分析基盤を提供している会社で、「世界で唯一のデータ&AI企業」を提唱しています。会社設立は2013年で、お客様は世界的な大企業から中堅中小に至るまで5000社以上、パートナーアライアンスも拡大中です。日本法人ができたのは2019年のことですが、2020年9月から積極的にビジネス展開を始めました。
2021年2月には、シリーズGの資金調達に成功し、評価額は280億ドルになりました。今回の調達ではAmazon Web Services (AWS)、CapitalG(Alphabet傘下のPEファーム)、Salesforce Venturesが加わり、既存のMicrosoftと合わせてメジャークラウド4社が我々に投資していることになりました。これはとても珍しいことで、企業がマルチクラウドを運用することになるという将来を見据えてのこととみています。
――AWS、Google、Microsoftはいずれもクラウド型データウェアハウス製品を提供しています。データブリックスが提供しているのはどんな製品でしょうか。
竹内:我々が提供しているのは、AWS、Google Cloud Platform、Microsoft Azureの上で稼働する「レイクハウス・プラットフォーム」です。構造化データだけでなく、半構造化データ、非構造化データ、ストリーミングデータを格納するデータストレージ「Parquet」、フォーマットを統一して分析や機械学習のモデル構築に利用できるようにする「Delta Lake」、データエンジニアやデータサイエンティストのためのアプリケーション、そして組織の中のコラボレーションを促す環境を提供しています(図1)。
製品カバレージは広いと思いますが、パートナーエコシステムの拡充を続けています。例えば、ETL(Extract/Transform/Load)の処理では他の製品を利用する必要があります。また、データブリックスとしてもデータアナリスト向けにBIツールを提供していますが、コーディングを全くやりたくない場合は、他のツールを利用する選択肢もあります。さらに、機械学習のサービスもクラウド3社が持っているものを併用するなど、共同で問題を解決するパートナーが実際には多いのです。