SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

最新イベントはこちら!

Data Tech 2024

2024年11月21日(木)オンライン開催

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

EnterpriseZine(エンタープライズジン)

EnterpriseZine編集部が最旬ITトピックの深層に迫る。ここでしか読めない、エンタープライズITの最新トピックをお届けします。

『EnterpriseZine Press』

2024年夏号(EnterpriseZine Press 2024 Summer)特集『ニューリーダーに訊く──2024年春、CxOに就任した2人が目指す姿とは』

DB Press

3000億円を投資したイオン巨大DB統合の裏側 “and条件”で実現する多様性に富んだ基盤構築術

イオン CTO 山﨑賢氏がデータ統合の軌跡と展望を語る

280テラバイト超を抱える巨大データ基盤を内製?

 IDの統合と共に、データの統合にも取り組んでいる。具体的には、グループ共通のデータ基盤をほぼフルスクラッチで立ち上げ、2024年に構築が完了している。「グループ会社300社のデータ統合は途方に暮れるような作業ですが、着々と進んでおり、購買データでいうと、グループ全体の7割ほどがデータ基盤に統合されています」と山﨑氏。構築されたデータ基盤をiAEONのアプリIDと統合した結果、顧客の購買行動の7割ほどが、横断的にアドホック分析できるようになった。

 このデータ基盤は、Microsoft Azureの日本リージョンに置かれている。統合した300の事業会社はばらばらの通信プロトコルをもっているため、各システムに対してETLの仕組みを個別に組み上げているという。

 「データ変換の主導権をデータ基盤側でもって事業会社にも強制させようとすると、事業会社側がついてこられなくなってしまいます。そのため、事業会社側がなるべく心地良い環境を作るために、すべてのデータを集めるETLを各システムに合わせて作り上げていく方針を取っています」(山﨑氏)

 その結果、データを集めるためのETLが無数にできあがっている状態だ。それらを使って集めたデータは、Apache Sparkに渡されて処理される。これは、レイクハウスのデータを論理的に整理する「メダリオンアーキテクチャ」で設計されており、ブロンズ、シルバー、ゴールドとデータのレイヤーを遷移することで、データが洗練され、品質を高められるもの。そして最終的にデータウェアハウス(DWH)やデータマートを作る流れになっている。

データ基盤の構成図
[画像クリックで拡大]

 このデータ基盤に対し、イオンはグループ全体で使えるアプリケーションを提供している。その1つがカスタマー・データ・プラットフォーム(CDP)だ。山崎氏はこれについて、「顧客を分析してタグ付け、セグメンテーションを行い、A/Bテストを実施した結果からクーポンの配信ができるような仕組みを作り上げました。事業会社の社員たちは、これを試行錯誤して使いながら、自社のマーケティングに生かしています」と説明する。

 もう1つが、従業員向けスマートフォンアプリだ。たとえば、店舗のどの棚にどの商品が設置されているかといった“棚割り”のデータがこのアプリケーションにすべて入っている。「商品がどこにあるか、商品がその店舗でいくつ売れたか、在庫は何個あるかといったデータほぼリアルタイムで可視化できます」と山﨑氏。

 さらに、地磁気の情報の活用も考えているという。地球の地磁気は、場所によりベクトル値が異なり、その情報から位置を特定できる。その位置情報を用いると、たとえばネットスーパーにおける商品のピッキングで、集荷の最短ルートを導き出すことが可能だ。それをAIに学習させ、ルートを最適化するようなアプリケーションも検討されている。

 現状、データ基盤全体では、圧縮状態のデータが約280テラバイト存在する。加えて、POSのデータだけでも毎日180ギガバイトほどが生成されている。かなり巨大なデータベースを構築し運用している状態だ。

3年でIDとデータを統合、次のステップとは

 このような取り組みの結果、3年間で「IDとデータの統合」という当初の目標は達成した。「まだ完成には至っていないが、ひな形はできあがっているので、あとはスピード感をもって拡張していく段階に入っています」と山﨑氏は語る。

 一方で、各事業会社が求める多様な分析に対応できるデータ提供環境はまだ整っていない。前述したCDPや従業員向けアプリは、あくまで本部側が用意したものをマニュアルと共に提供し、決められた使い方をするものだ。

 理想をいえば、各事業会社がデータサイエンティストを抱え、自社のローカルデータと連携したアドホック分析を行えるようにしたい。しかし、そのためには個別の要件定義が必要となり、現状ではその実現に苦労していると山﨑氏。

 たとえば、ある事業会社から自社のPOSデータを自社で分析できるようにしたいと要望が挙がれば、CSV形式のデータを作成して渡したり、毎日深夜にバッチで渡すように設定したりする個別の対応を取ることとなる。そうなると、別の事業会社も似たようなデータで少しカラムの構成が違うものが欲しいと言うかもしれない。それに対しても専用のバッチを作り対応するのか。一つひとつに対応しているときりがなくなってしまう。

 極めて大きなデータ基盤をほぼ内製で、フルスクラッチで作り上げた実績から、イオンの中には「内製で作るべき」といった意識が生まれていると山﨑氏は指摘。各事業会社の要求に対しても、それぞれ必要なデータを提供するバッチ処理の仕組みを作り、必要なインターフェイスも含めてすべて構築して提供すれば良いといった文化のようなものができているという。このような状況について「データが欲しいところに対して、個別にプログラムを作って渡すようなことは極めて非生産的なので、こうしたやり方は変えていかなくてはいけないと思っています」と話す。

次のページ
データを扱うソリューションは「and条件」で選ぶ

この記事は参考になりましたか?

  • Facebook
  • X
  • Pocket
  • note
DB Press連載記事一覧

もっと読む

この記事の著者

谷川 耕一(タニカワ コウイチ)

EnterpriseZine/DB Online チーフキュレーターかつてAI、エキスパートシステムが流行っていたころに、開発エンジニアとしてIT業界に。その後UNIXの専門雑誌の編集者を経て、外資系ソフトウェアベンダーの製品マーケティング、広告、広報などの業務を経験。現在はフリーランスのITジャーナリスト...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/20482 2024/10/30 08:00

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング