Snowflakeは米国時間6月3日、年次ユーザーカンファレンス「Snowflake Summit 2024」において、ベンダーニュートラルでオープンなカタログ実装「Polaris Catalog」を発表した。
今回発表されたPolaris Catalogは、データレイクハウス、データレイク、その他の最新アーキテクチャの実装に選択されるオープンスタンダードであり、データテーブルフォーマット「Apache Iceberg」向けに作られているもの。今後90日以内にオープンソース化され、企業やIcebergコミュニティ全体に、Amazon Web Services(AWS)、Confluent、Dremio、Google Cloud、Microsoft Azure、Salesforceなどとのエンタープライズ・セキュリティとApache Icebergの相互運用性を備えた新たなレベルの選択肢、柔軟性、データ制御を提供する予定だとしている。
また、Polaris CatalogはIcebergのオープンソースであるRESTプロトコルに依存しており、Apache Flink、Apache Spark、Dremio、Python、Trinoなど、Iceberg Rest APIをサポートしている任意のエンジンから、ユーザーがデータにアクセスして取得できるオープンスタンダードを提供しているとのことだ。
組織は、SnowflakeのAIデータクラウドでホストされたPolaris Catalogの運用を数分で開始できるという。または、DockerやKubernetesなどのコンテナを使用して、独自のインフラでセルフホストすることも可能。Polaris Catalogのバックエンド実装はオープンソースであるため、組織はベンダーロックインを排除しつつ、ホスティングインフラストラクチャを自由に入れ替えられるとのことだ。
さらにSnowflakeは、Polaris Catalogがより広範なコミュニティや環境の進化するニーズに確実に応えられるよう、Icebergのエコシステムと協力してプロジェクトを推進しているという。
加えて、SnowflakeとMicrosoftが締結した直近のパートナーシップ拡大にともない、SnowflakeとFabric間で相互運用性を実現するとしている。この相互運用性は、Apache IcebergとApache Parquetをサポートするというコミットメントによって可能になったとしている。
【関連記事】
・「CData Sync」にSnowflakeからSalesforceへのデータ更新機能が追加
・Snowflake、企業のAI活用を支援するオープンなLLM「Arctic」を発表
・住友生命「Vitality」のデータ分析基盤にSnowflake採用、年間約50%のコスト削減へ