データを扱うソリューションは「and条件」で選ぶ
データ活用においてよく議論される内容として「シングルプラットフォームを採用すべきか」が挙げられる。これは、オンプレミスかクラウドか、データプラットフォームならSnowflakeかDatabricksか、DWHならBigQueryかRedshiftかなど、与えられた条件からどれか一つを選ぶべきといった話だ。
山﨑氏はこれに対して「データソリューションは多様化しており、特定の条件下で最適なプラットフォームを一つに絞り込むことは困難です」と主張。イオングループのように多様性に富んでおり、ユースケースも多く存在する企業にとって、「シングルプラットフォームで何かを変えようとするのは、自らに足かせをはめるようなものでしかありません。そのため、『and条件』で考えるような柔らかい発想の転換を促しています」と話す。
「Snowflakeは優れたソリューションですが、他のソリューションにもそれぞれ強みがあります。すべての要件を満たす単一のプラットフォームは存在しないため、イオングループでは適材適所でソリューションを組み合わせる方針を取っています」(山﨑氏)
このような方針のもと、イオングループは、Snowflakeをデータコラボレーションのレイヤーで用いるものとしてデータ基盤に組み込むことを決定。現在、実装を進めているところだという。
山﨑氏は、Snowflakeの利点として「データクリーンルームやマーケットプレイスなど、多様なデータ提供パターンを有していること」、またこれによって「オープンな世界の中に情報が網羅され、情報が欲しいプロトコルをユーザー側が選べるようになっていること」を挙げた。ユーザー側にSnowflakeの機能を網羅的に提供することで、ユーザーにはSnowflakeを学習してもらい、どのようにデータが欲しいかを自分たちで調べて取得できるようにする。これが実現することで、より建設的なデータ活用の議論が各事業部門とできるようになる状態を目指すという。
400テラバイト超の商品情報もSnowflakeへ移行
さらにイオングループでは、Snowflakeを他の用途でも利用しようとしている。イオングループには「商品DWH」と呼ぶ商品マスター情報を管理するデータベースが存在する。これは500以上のETL、7000以上のテーブル、400テラバイト以上のデータ量をもつ巨大データベースだ。現在、これをSnowflakeへ移行するプロジェクトが進められているという。Snowflakeに移行することで様々なデータとジョインして、活用できる状態にすることが狙いだと山﨑氏。
もう一つ取り組んでいることが、リテールメディアでの利用だ。今でこそ先延ばしにされているものの、GoogleがサードパーティーCookieを廃止すると、Google広告の領域においてパーソナライゼーションができなくなる。そのため、GoogleのサードパーティーCookie廃止後にもパーソナライゼーションを行うためには、ファーストパーティーデータを集め、それを分析して顧客の行動を把握する必要が出てくる。
ファーストパーティーデータの活用においては、リテール(小売)企業が自社で保有する消費者の購買データなどを活用して、広告を効果的に配信する仕組みであるリテールメディアが注目されている。イオングループでもブランドやメーカーと協業して、リテールメディアの事業に取り組むことを検討しており、そのプロジェクトのデータ管理アーキテクチャの中心にSnowflakeが位置づけられているという。
山崎氏は最後にまとめとして、改めてデータを扱うソリューションを選ぶ際は「or条件」ではなく「and条件」で考えるべきだと力説した。また、イオングループのように多様なデータソースをもつ場合は、多様なETLが増えていくことはある程度仕方がないものとする一方で、集めたデータを提供するレイヤーでは多様なプロトコルを用意し、その中でユーザーに選んでもらえるようにする。このような環境を、Snowflakeとともに実現しつつあるという。「データを用いることで、ビジネスに対する成果を得る。それがデータを活用するユーザーにとって最終目的だと思っています。今後もその視点でデータのソリューションと向き合っていきたいです」と語り、講演を締めくくった。