約8億ドル買収も「将来的には安く見える」
──まずは、最新の製品戦略について教えてください。特に、製品戦略面から振り返ると、2022年をどのように見ていますか。
そもそもSnowflakeの目標は、企業のデータが“モビライズ(流通)”することを促進し、ユーザーが戦略的なデータ活用を通じて価値を引き出すことを支援することです。
改めて話すまでもありませんが、「データを活用している組織は同業他社に比べて業績が良い」という調査結果が複数社から出ています。そして、そのために当社が取り組んでいることは、大きく3つに分けられます。
1つ目は、データとアナリティクス。我々はアナリティクスの現状を変えたいという願いからスタートしました。それは現在でも変わっていません。2つ目はコラボレーションです。データに関するコラボレーションを容易にすること。そして、3つ目はアプリケーション開発であり、ここが新たに挑戦している分野です。これら3つをすべて単一のプロダクトで実現していきます。では、それぞれ具体的に説明しましょう。
最初に挙げたアナリティクスでは、データをプラットフォームに置くことでサイロをなくし、容易なクエリ(データの抽出や更新など)を実現することを目指しています。プラットフォームのコアとなる部分で、クエリの高速化やガバナンス強化、クロスクラウド/クロスリージョンでのデータサービス提供などを担っている「Snowgrid」の強化を発表しました。
Snowflakeが処理時間で課金していることもあり、クエリに関する性能改善は応答速度の向上だけでなく、ユーザーのコスト削減にもつながります。つまり、ユーザーの成功は我々の成功であるため、性能改善を定期的に実施しているのです。
また、コラボレーションにおいては、自社のデータだけでなく他のデータを組み合わせることで、データに“文脈”を加えることができます。どういうことか。たとえば「日本市場での売上が3000万ドル」といっても、業績として素晴らしいのかそうでないのか判断が難しい。しかし、GDPや業界規模などの情報がわかれば、データが新たな意味(=文脈)を持つことになります。これを可能にするのが「Snowflake マーケットプレイス」であり、既に300以上のデータプロバイダーがデータを提供しており、リアルタイムで必要なデータを利用(データに文脈をもたせることが)できます。
そして、新たな挑戦を続けているのがアプリケーション開発。新規構築されるアプリケーションは、何らかのデータを利用しています。実際には、既存データをコピーして使うことが多いのですが、我々はこれを変えたいと考えています。
そもそも、データをあちこちに持っていくと、セキュリティを含めて複雑性が増します。そこで、“アプリケーションをデータに持っていく”というアプローチがSnowflakeのアイデアです。企業は中央に単一のデータを持ち、データが散在しない分だけ価値をどんどん高めることができます。これを実現するための製品機能が開発者向けの「Snowpark」であり、PythonやJavaなどの言語をサポートしています。2022年11月には「Snowpark for Python」を一般提供できたなど、2022年はSnowflakeの製品戦略を順調に進めることのできた年となりました。
──特にアプリケーション開発に関しては、2022年にStreamlitを買収しています。約8億ドルという金額も注目を集めましたが、買収の狙いなどを教えてください。
Snowflakeがアプリケーション開発にフォーカスする理由は、顧客がガバナンスを効かせた形でデータを活用し、より多くの価値を得るという当社の目標に結びついているからです。
機械学習を中心としたアプリケーションが増えている状況下で、Snowparkのニーズが高まっていると見ています。Snowflake内で計算処理を行い、JavaやPythonを安全にホスティングできるだけでなく、Apache Sparkと相違ない形でデータの変換や運用ができるからです。加えて、ガバナンスを強化しながらも高速かつ安価という、Snowflakeの特性も活きています。このような理由から、実はApache Sparkからの移行が増えているのです。
数年がかりで少しずつ新機能を提供していますが、現在は「より簡単に、より高速にデータを利用できること」にフォーカスを当てています。つまり、ストリーミングソリューションです。データの生成からアナリティクスのダッシュボードに反映されるまで1分から最大5分ほど必要ですが、これを大幅に削減して10秒以下で実現したいと考えています。
そして、これらを活かしたアプリケーションやビジネスロジックは、何らかのUIを必要とするため、ここをStreamlitが担うのです。
Streamlitは約80万人の開発者が毎月アクティブに利用しており、“データ体験”を構築するフレームワークとしてのデファクトスタンダードと言えます。たとえば、「ChatGPT」が話題ですが、ChatGPTの数学版と言われる「MathGPT」はStreamlitを使っています。またプリンストン大学の学生は、ChatGPTを使った文章かどうかを検出する「GPTZero」を、Streamlitを使って構築しているのです。
このように、開発者やデータアナリスト、データサイエンティストの間で口コミで広まっただけあって、美しいUI/UXを簡単に構築できます。そこで、SnowflakeはStreamlitの統合を進めており、データをコピーすることなくStreamlitを使ってUIを構築できるようにします。これは、ビジネスインテリジェンス(BI)とアプリケーション開発の間を埋めるものであり、BIよりもリッチな体験だがWeb開発ほどの柔軟性はないという位置づけです。
また、Streamlitを買収した理由を付け加えるならば、既に開発者コミュニティがあり、素晴らしい製品だったからです。多くのデータサイエンティストが愛用しているという点が大きな評価ポイントでした。
機械学習や言語モデルの分野は現在、急速に進展しています。ここで選ばれているのがStreamlitであり、将来振り返ったときに「買収金額は安かった」と感じることでしょう。
──買収戦略についてお聞きします。2023年に入り、LeapYearの買収を発表しました。この意義をはじめ、買収戦略の全体像を教えてください。
我々は、大型買収をするつもりはありません。単一プロダクト、単一処理エンジンという製品戦略の下で進めています。(大型の買収で)バラバラのものを揃えることが顧客の価値につながるとは思えないからです。
データを流通させる、企業がデータから価値を得ることを支援するという明確な目標を持っており、そこに向けた明確な計画と道筋を描いています。この計画を加速できるものであり、かつ単一プロダクトに統合可能なものであれば買収する可能性があるということです。
そしてLeapYearは、Snowflakeが注力しているガバナンスとコラボレーションの強化に寄与するものです。患者データなど、コラボレーションをしたいが、プライバシーの懸念が残るデータもあると思います。このようなニーズに対して、当社はこれまで「データクリーンルーム(Global Data Clean Room)」の開発を進めてきました。しかし、一部のユースケースでは、“数学的に証明された”方法でプライバシーを担保したいというニーズが出てきており、差分プライバシー技術をもつLeapYearを買収することで合意しました。