
データクラウド大手Snowflakeは7月17日、全日本空輸(以下、ANA)が構築を進めるデータ基盤「BlueLake」に関する記者説明会を開催した。この基盤は、SnowflakeとオープンソースのApache Icebergを中核に据え、ANAの約4万人にも及ぶ全従業員がデータを活用できる「データ民主化」を強力に推進するものだ。Snowflakeのホイットニー・ホーソーン氏と、ANA デジタル変革部イノベーション推進部データマネジメントチームの井岡大氏が登壇し、その詳細と未来への展望を語った。
航空業界の課題とSnowflakeの解決策
会見の冒頭、Snowflakeのホイットニー・ホーソーン氏は、航空業界が直面する3つの主要課題として「顧客体験と収益性の向上」「コスト削減と運用効率向上」「革新と新しい収益源の創出」を挙げた。これらの実現には、強固なエンドツーエンドのデータサプライチェーンが不可欠であるとし、既存のデータサイロや不正確なデータが価値実現を妨げていると指摘した。また、「データ戦略なくしてAI戦略はない」と語り、AI活用にはまず堅牢なデータ基盤構築が不可欠であると強調した。
Snowflake AIデータクラウドは、すべてのデータニーズに対応する単一のクラウドサービスとして、これらの課題解決に貢献すると同氏は言う。少ないチームでも管理が容易で、高い伸縮性を備えている点が強みだ。また、幅広いエコシステムとのシームレスなゼロコピーデータ共有を可能にするマーケットプレイスへのアクセスを提供し、多様なデータを瞬時に活用できる。これにより、動的な価格設定やサプライチェーン最適化、運用効率化に役立つと説明した。
「BlueLake」が切り拓くデータ民主化と課題解決
続いて、ANAの井岡大氏が同社のデータマネジメントプロジェクトについて説明した。ANAグループは、ANA、Peach、AirJapanの3ブランドで航空事業を展開し、非航空事業であるANA経済圏の構築にも注力している。
井岡氏は、創立70周年を機に刷新された経営ビジョン「ワクワクで満たされる世界を」の実現には、データ活用が不可欠であると強調した。利用前から利用後までのあらゆる体験を一元的に管理されたデータで分析・評価し、PDCAサイクルを回すことで顧客体験の向上に努めているという。
ANAはデータの民主化に向けたデータマネジメント構想を推進しており、「お客様向けにパーソナライズされたデジタルサービスを提供するためのCXシステム」「社員向けに分析を行うためのデータ基盤(Data lake/Data warehouse)」の3つの要素で構成されている。今回の発表はそのうちの「データ基盤の進化」にあたるものだ。

ANAのデータ基盤「BlueLake」は段階的に進化してきた。2022年に構築したV1ではAmazonのS3をデータレイクとして活用し、2023年のV2でデータウェアハウスを導入。2024年のV3でデータ仮想化技術を取り入れ、データ活用の幅を広げた。現在は、Snowflakeを主要技術とするBlueLake V4の本格的な開発に着手している。さらにV4は、リアルタイムな情報を扱うCX基盤と密接に連携し、お客様体験価値向上、従業員の生産性向上、そしてより良いビジネスの意思決定のために活用されている。

BlueLake V4:Iceberg導入による進化とチャレンジ

BlueLake V4のアーキテクチャでは、Apache Icebergの導入により、従来のAmazon S3間でのファイル処理から脱却する。SnowflakeのデータベースイメージでIcebergテーブル間のデータ処理が行われ、データは自動的にAmazon S3上に保存される。これにより、ETLの性能は3.9倍、クエリの性能は1.6倍向上したと井岡氏は明かした。

V4へのアプローチとして、データの管理フォーマット変換とETL機能の強化が進められている。既存のParquetファイルをIceberg形式に変換し、Snowflakeを介したIceberg処理のためにdbtを活用している。「dbtによってSQLロジックも共通化し、さらなる汎用性を追求しようと考えております」と井岡氏は述べ、これにより変化への適応力とアジリティを高めるとした。井岡氏は、Snowflakeに関わる3つの具体的なチャレンジ事例を紹介した。
生成AIとデータ基盤連携のPoC
さらに井岡氏は、最近のBlueLakeデータを生成AIで活用するPoCの事例を紹介した。Snowflakeのオープンソース開発環境であるStreamlitとSnowflakeに実装されているLLM関数を活用し、旅先のおすすめを提案するプロトタイプアプリケーションを開発。「データと生成AIで何かができないかといった抽象的なリクエストがあったとしても、Snowflakeの中で簡単に実現することができます」と井岡氏は語る。データ処理、Streamlit、LLMの全てがSnowflakeの中で完結するため、チャレンジへの敷居が低い点が評価されたという。

またカスタムデータコネクターのPoCの事例も紹介した。コネクタデータ環境を約3日で構築、月々1,500円のコストで運用を実現した。「外部からのデータ連携の接続を作らなくてもセキュリティ環境を担保してくれる点、開発効率と運用効率の両面で効果を感じています」と井岡氏は述べた。
このように、ANAグループの全従業員が利用することを考慮し、データの民主化に不可欠なデータカタログとデータ抽出ツールを内製で開発。提供開始から数年が経過し、ユーザーが増加している。内製化により運用コストを大幅に削減できたという。「Snowflakeを活用し、統合された1つのデータプラットフォームをBlueLakeとして展開することで、コストが最適化され、開発や運用の効率が大きく向上しました。結果として、これまでよりも格段に高いアジリティでデータ活用ができるようになっていると感じています」と井岡氏は語った。
この記事は参考になりましたか?
- この記事の著者
-
京部康男 (編集部)(キョウベヤスオ)
ライター兼エディター。翔泳社EnterpriseZineには業務委託として関わる。翔泳社在籍時には各種イベントの立ち上げやメディア、書籍、イベントに関わってきた。現在はフリーランスとして、エンタープライズIT、行政情報IT関連、企業のWeb記事作成、企業出版支援などを行う。Mail : k...
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア