1日52億レコードを処理するセブンセントラルデータ活用基盤

1973年11月の創業から、1974年5月に豊洲に第1号店を出店してから50年超、今では全国に21,733店舗(2025年3月末現在)を運営するまでに成長したセブン-イレブン・ジャパン。商品を製造する工場は約170ヵ所、物流センターが約160ヵ所、約30ヵ所の本部と地区事務所も約30ヵ所にもなる。また、加盟店オーナーの経営支援を行うOFC(Operation Field Counselor)は約3000人おり、それぞれが担当する7〜8店舗のオーナーの経営支援に日々携わる。
そして、工場から、共同配送センター、店舗、顧客までを繋ぐサプライチェーンを支えているのが、多くのITシステムである。セブン-イレブンと言えば、古くからITに積極投資をしてきたことで知られる企業だ。その中核が、本部から、店舗、物流センター、取引先までを結ぶ「総合店舗情報システム」である。何度も更新を続けて洗練させてきた店舗システムは、同社の最大の強みである「単品管理」を支えている。
データドリブンでの単品管理を極め、常に店頭に欲しい商品がある状態を維持する。これを国内21,000以上の店舗全てで実践するともなれば、安全で堅牢なデータ管理基盤が不可欠だ。西村氏が「セブン-イレブン・ジャパンでは、社長から担当に至るまで、毎朝1人ひとりが全店の数字を確認する。これは数10年間やってきた習慣」と語るように、創業以来、データを経営に活かす組織風土が培われてきた。その蓄積を活かし、将来に向けたIT戦略を支えるために構築したのが、データ活用基盤「セブンセントラル」だ。2020年9月から稼働を開始したこの基盤の裏では、Google BigQueryやGoogle Cloud SpannerのようなGoogle Cloudのテクノロジーが動いている。
このセブンセントラルから、加盟店オーナーはBIツール、従業員や取引先はアプリから、店舗システムや基幹システムのデータにアクセスできるようにした。データへの接続は最短1分でできる。西村氏は、「セブンセントラルが1日に処理するレコード数は52億件にもなる」と述べ、以前は翌日の朝までかかっていたデータ処理が、クラウド上での安全な共有に変わったと紹介した。
「セブン-イレブンAIライブラリー」は攻めと守りの両輪の生成AI基盤
北海道から沖縄まで、日本全国の店舗のデータがほぼリアルタイムで見られるようになった結果、何ができるようになったか。西村氏は攻めと守りの2つに分けて詳細を説明した。まず、攻めのデータ活用では、新しいサービスの機会創出につながった。その代表例が2022年に専門組織を立ち上げて展開中のリテールメディア事業だ。この事業は、店舗それぞれを広告媒体として捉え、広告主を募るもので、データは広告の展開後にその施策がどれだけ効果的だったかの検証に役立つ。一方、守りのデータ活用では、自然災害の発生時の商品在庫の最適化の例を西村氏は挙げた。被災地の周辺店舗にどんな商品在庫があるかを把握できるようにしておけば、いざという時に適切な打ち手を講じることができる。
西村氏は「セブンセントラルを構築した時の目標は、いかにコントローラブルなデータ基盤を作るかだった」と構築当時を振り返る。前述のような新しいユースケースが生まれたが、課題も認識していた。それは自由にデータにアクセスできる人たちが限られていたことだ。もちろん、IT部門に所属しているデータエンジニアのような専門知識がある人たちは問題ない。しかし、大多数の社員はやりたいことの手前で、一度IT部門に依頼しなくてはならない。データドリブン経営の先駆者としての自負があるからこそ、全社員が自由にデータを使える状態を作らなければならないと同社は考えた。この「データ民主化」の実現に向けて選択した解決策がリスキリングである。しかし、これを徹底するのは現場への負荷が大きく、時間がかかる。そこで同社は生成AIに目を付けた。
セブン-イレブンの生成AIジャーニーは、2023年5月の生成AIに関する社内啓発から始まった。同年8月に生成AI基盤「セブン-イレブンAIライブラリー」を構築し、11月から役職者及びシステム本部員を対象とする範囲を絞っての活用が始まった。生成AI活用を始めるにあたり、同社が懸念したのは当時から話題になっていたハルシネーションだ。そこで、データの漏洩対策を施した上で、良いところを見つけることを優先する決断をした。その後、多くの試行錯誤を繰り返し、2024年9月に他本部を含む全面的な活用が可能になった。