280テラバイト超を抱える巨大データ基盤を内製?
IDの統合と共に、データの統合にも取り組んでいる。具体的には、グループ共通のデータ基盤をほぼフルスクラッチで立ち上げ、2024年に構築が完了している。「グループ会社300社のデータ統合は途方に暮れるような作業ですが、着々と進んでおり、購買データでいうと、グループ全体の7割ほどがデータ基盤に統合されています」と山﨑氏。構築されたデータ基盤をiAEONのアプリIDと統合した結果、顧客の購買行動の7割ほどが、横断的にアドホック分析できるようになった。
このデータ基盤は、Microsoft Azureの日本リージョンに置かれている。統合した300の事業会社はばらばらの通信プロトコルをもっているため、各システムに対してETLの仕組みを個別に組み上げているという。
「データ変換の主導権をデータ基盤側でもって事業会社にも強制させようとすると、事業会社側がついてこられなくなってしまいます。そのため、事業会社側がなるべく心地良い環境を作るために、すべてのデータを集めるETLを各システムに合わせて作り上げていく方針を取っています」(山﨑氏)
その結果、データを集めるためのETLが無数にできあがっている状態だ。それらを使って集めたデータは、Apache Sparkに渡されて処理される。これは、レイクハウスのデータを論理的に整理する「メダリオンアーキテクチャ」で設計されており、ブロンズ、シルバー、ゴールドとデータのレイヤーを遷移することで、データが洗練され、品質を高められるもの。そして最終的にデータウェアハウス(DWH)やデータマートを作る流れになっている。
このデータ基盤に対し、イオンはグループ全体で使えるアプリケーションを提供している。その1つがカスタマー・データ・プラットフォーム(CDP)だ。山崎氏はこれについて、「顧客を分析してタグ付け、セグメンテーションを行い、A/Bテストを実施した結果からクーポンの配信ができるような仕組みを作り上げました。事業会社の社員たちは、これを試行錯誤して使いながら、自社のマーケティングに生かしています」と説明する。
もう1つが、従業員向けスマートフォンアプリだ。たとえば、店舗のどの棚にどの商品が設置されているかといった“棚割り”のデータがこのアプリケーションにすべて入っている。「商品がどこにあるか、商品がその店舗でいくつ売れたか、在庫は何個あるかといったデータほぼリアルタイムで可視化できます」と山﨑氏。
さらに、地磁気の情報の活用も考えているという。地球の地磁気は、場所によりベクトル値が異なり、その情報から位置を特定できる。その位置情報を用いると、たとえばネットスーパーにおける商品のピッキングで、集荷の最短ルートを導き出すことが可能だ。それをAIに学習させ、ルートを最適化するようなアプリケーションも検討されている。
現状、データ基盤全体では、圧縮状態のデータが約280テラバイト存在する。加えて、POSのデータだけでも毎日180ギガバイトほどが生成されている。かなり巨大なデータベースを構築し運用している状態だ。
3年でIDとデータを統合、次のステップとは
このような取り組みの結果、3年間で「IDとデータの統合」という当初の目標は達成した。「まだ完成には至っていないが、ひな形はできあがっているので、あとはスピード感をもって拡張していく段階に入っています」と山﨑氏は語る。
一方で、各事業会社が求める多様な分析に対応できるデータ提供環境はまだ整っていない。前述したCDPや従業員向けアプリは、あくまで本部側が用意したものをマニュアルと共に提供し、決められた使い方をするものだ。
理想をいえば、各事業会社がデータサイエンティストを抱え、自社のローカルデータと連携したアドホック分析を行えるようにしたい。しかし、そのためには個別の要件定義が必要となり、現状ではその実現に苦労していると山﨑氏。
たとえば、ある事業会社から自社のPOSデータを自社で分析できるようにしたいと要望が挙がれば、CSV形式のデータを作成して渡したり、毎日深夜にバッチで渡すように設定したりする個別の対応を取ることとなる。そうなると、別の事業会社も似たようなデータで少しカラムの構成が違うものが欲しいと言うかもしれない。それに対しても専用のバッチを作り対応するのか。一つひとつに対応しているときりがなくなってしまう。
極めて大きなデータ基盤をほぼ内製で、フルスクラッチで作り上げた実績から、イオンの中には「内製で作るべき」といった意識が生まれていると山﨑氏は指摘。各事業会社の要求に対しても、それぞれ必要なデータを提供するバッチ処理の仕組みを作り、必要なインターフェイスも含めてすべて構築して提供すれば良いといった文化のようなものができているという。このような状況について「データが欲しいところに対して、個別にプログラムを作って渡すようなことは極めて非生産的なので、こうしたやり方は変えていかなくてはいけないと思っています」と話す。