オープンテーブルフォーマット「Iceberg」へのシフトを鮮明に
10月18日(米国時間)、Snowflakeはカタログサービス「Snowflake Open Catalog」の一般提供開始(GA)を発表した。これはThe Apache Foundationのインキュベーションプロジェクトである「Apache Polaris」のマネージドサービスで、以前は「Polaris Catalog」としてプレビュー提供されていたものである。なお、GAから半年間(2025年4月30日まで)は無料で利用可能だ。
Open Catalogのリリースは、Snowflakeの“Icebergシフト”をさらに強化する方針を示した発表として注目される。Snowflakeは2022年からオープンソースのテーブルフォーマットである「Apache Iceberg」を全面的にサポートしているが、Polaris CatalogはこのIcebergとの相互運用性に特化したカタログ実装としてSnowflakeが2024年6月にリリースしたものだ。その後、オープンソースプロジェクトとして公開し[1]、外部からのフィードバックを反映しながら今回のOpen CatalogのGAに至っている。
Snowflakeには既に「Snowflake Horizon Catalog」という同社ネイティブなデータカタログを提供しているが、その一方で多くのコンピュートエンジンをサポートし、コミュニティ活動も活発なIcebergをコアにしたエコシステムの拡大を図ることで、ベンダーロックインを嫌うユーザーからも支持を得やすくなる可能性は高くなるだろう。特に単独のパブリッククラウドに依存したくない企業にとって、メタデータを高い透明性で扱えるメリットは非常に大きい。
9月に都内で開催された「Snowflake World Tour Tokyo」のために来日したSnowflake CEOのスリダール・ラマスワミ(Sridhar Ramaswamy)氏は、報道関係者向けのラウンドテーブルで「Icebergを一気通貫でサポートすることにより、より多くの顧客がSnowflakeのシステムに接する機会が増えると思っている。データプラットフォームとしてSnowflakeほど多様なアーキテクチャをサポートできるところは他にない」と語っていた。
Google出身のラマスワミ氏は2月に同社CEOに就任したが、CEOとしてのゴールを問われた際に「GoogleやMeta(旧Facebook)、テスラ、シーメンスのように、プロダクトストラテジーだけでなくデータストラテジーを実践し、データのフィードバックループを構築して成功を収める企業を数多く支援していく。データはコスト削減のためだけではなく、リアルバリューを提供するためにあることを顧客に伝えていきたい」と回答している。そしてそのゴールを実現するためのキードライバーとして選んだのがIcebergというわけだ。今後、Snowflakeのイノベーションにより深く関わってくる技術として注目しておきたい。
[1] ブログ「Polaris Catalogがオープンソースに」(Snowflake、2024年7月30日)