Shoeisha Technology Media

EnterpriseZine(エンタープライズジン)

EnterpriseZine(エンタープライズジン)

テーマ別に探す

【第二回】アソシエーション分析:購買分析からレコメンデーション応用まで

2014/10/23 08:00

 アクセンチュアの全世界組織であるアクセンチュア アナリティクスチームが贈る「意思決定のためのデータサイエンス講座」。第二回目となる今回は、購買分析に効くアソシエーション分析を紹介します。

 

購買分析に効く!アソシエーション分析

 第一回では、人工知能プログラミングの概要から入りました。今回は二回目であり、具体論の初回ということで、皆さんが日々の生活で少なからずお世話になっているであろう身近なデータを扱うことで、機械学習に対する親近感を持っていただけたらと考えて、まずはコンビニエンスストアなど商品明細POSデータに代表されるトランザクションデータを扱っていきたいと思います。できる限り実際の状況を意識しながら、探索問題の一つであるアプリオリアルゴリズムの応用、アソシエーション分析の基礎について解説していきます。

 アソシエーション分析(別名:マーケットバスケット分析)は、90年代に考案された分析手法で、代表的なものにRakesh Agrawal氏らが1993年に執筆した論文「Fast algorithms for mining association rules」 [Agrawal, R.; Imieliński, T.; Swami, A.]があり、トランザクションデータの規則性を抽出する実践的方法論が紹介されています。この分析手法ですが、売り上げ向上施策によく使われているのはご存知かもしれません。蓄積された顧客毎の取引データを分析し、併売の関係性が強い事象の組合せやその割合、統計的に見て強い関係を持つ事象間の関係(ルール)を抽出するデータマイニング手法で、「商品 A を購入した人は、商品 B も購入する確率が高い」という法則性(アソシエーションルール:指標詳細については後述)を見つけ出す分析手法です。

 アソシエーション分析の活用例で有名なものとしては、小売店における前述したトランザクション形式の代表例であるPOS データを利用した分析で、同時に購入されている確率が高い商品を明らかにし、その上で、店舗別のレイアウト設計、棚割りや商品配置の最適化、顧客別のクロスセル、アップセルや価格最適化に活用するケースが挙げられます。
 

 例えば、スーパーマーケットなどの小売店舗におけるPOSレジで支払いと同時に次回利用可能な動的なクーポンが発行されるケースがありますが、このようにトップライン増強策としての販売促進に利用されている実例を実務の世界でも良く見ます。
 

 飲食店においては追加注文のレコメンデーションなどクロスセルへの活用などが可能となります。既存顧客に対し、より上位の、高価なものを購入してもらうことをアップセル、いつも購入している商品やサービスに加え、関連する別の商品も推薦して、売上につなげることをクロスセルといいますが、アソシエーション分析は、このクロスセルに高い頻度で活用されます。
 

 EC サイトでは、購買履歴を分析し、顧客毎に最適化された商品が並んだトップページを提供することで顧客の利便性と顧客満足度(CS)の向上に貢献できます。また、購買履歴だけでなくウェブサイトへのアクセスログを用いて、ページ閲覧履歴の解析などにも応用可能です。

 各業種・業態別に見たアソシエーション分析の活用対象は表 1のようになります。

表1 アソシエーション分析の活用対象
業種/業態 分析 活用により得られる効果(例)
GMS(総合スーパーマーケット)
CVS(コンビニエンススストア)等
流通小売業全般
同時購入商品の組合せ
上記の店舗間比較
店舗内での商品陳列の最適化
購買動機の把握 
店舗間での顧客嗜好の比較
新規出店時の地理的特徴の把握
eコマース・デジタルコンテンツ産業 IDに紐付く過去の累積
購買履歴
サイト内のページ閲覧履歴
顧客毎にカスタマイズされたメールマガジン、インターネット広告、トップページによるコンバージョン率の向上
通信サービス・工業製品 製品本体とオプション製品(サービス)の組合せ オプション製品(サービス)同士の組合せ 携帯電話、プロバイダの料金プラン、付加オプションサービスの提案
オプション商品同士のセット販売による顧客インセンティブ
外食産業 トッピングメニューの組合せ
食べ物・飲み物・サイドメニューの組合せ
追加オーダーのレコメンド
新商品、セットメニューの考案
(時系列比較による)顧客動向の調査
金融サービス 金融商品の購入状況

投資対象銘柄の提案
顧客の嗜好、選択基準の把握

 このようなアソシエーションルールを発見する手法としては、アプリオリ(Apriori)アルゴリズムが広く知られています。アプリオリアルゴリズムでは、全アイテム(商品)の組合せに対して、ある商品Aとある商品Bが同時に購入される確率(支持度)を求め、さらにある商品Aに関するルールのうち、商品Bを含んでいる確率(確信度)を求めることで意味のあるルールを導き出します。つまり前者は特定の併売パターンの全体に占める割合、後者が特定の併売パターンでの結びつきの強さを表します。また、アプリオリアルゴリズムの他には、FP-Treeと呼ばれるツリー構造のデータモデルを利用することで高速化を図ったFP-Growthアルゴリズムがあります。系列性を考慮したアソシエーション分析(例えば、商品Aの後に商品Bを購入する確率と商品Bの後に商品Aを購入する確率を別として扱う)としては、SPADEアルゴリズムが知られています。

アソシエーションルールと評価指標

 アソシエーションルールは、X⇒Y(XならばY)の形式で示されます。この X を条件部、Y を結論部と呼びます。典型的な例としては、シャンプー⇒リンス(シャンプーならばリンス)、ビール⇒枝豆(ビールなら枝豆)などが想像できそうですが、レタス&ハム⇒コッペパン(レタスとハムならばコッペパン)のような条件部に複数の商品を仮定することも可能です。

 多くの場合、POSデータから得られるデータはSKU(最小管理単位; Stock Keeping Unit)単位で記録されますが、SKU毎に分析するとアイテム数が多すぎて有用な結果が得にくいため、グループ化の工夫が必要です。そしてグループ化の単位を「分析したいとしている」単位でグループ化することが重要です。このためにコード体系を整理する工程が必要となります。

 ビールに例えると、「食料品>飲料>アルコール飲料>ビール>ABC(ブランド)>ABCビール>ABCビール(350ml缶) 」など、どのレイヤーでグループ化を行うかを分析で明らかにしたい仮説と目的から検討し、設定する必要があります。ここはマーケターの分析の着眼点や目的が強く要求される領域になります。

 例えば、対象となる併売SKUの中に、同じブランドがあっても、パッケージングのボリュームに対する嗜好性を取りたいという特殊なケースもあるでしょう。事実、これまでのプロジェクトで、清涼飲料水1本あたりの消費量に対する嗜好性が時間別(午前と午後等)に変化する傾向にあることがこれまでのプロジェクトを通じた分析の経験上も分かってきていますから、そうした分析には同じ味やブランドでもSKUに容量ラベルがカテゴリ分けの軸に入っていることが重要になるでしょう。

 また、純粋に併売の傾向を顧客セグメント別に把握していきたい場合、属性情報による分布の絞り込みやグループ分けも重要になるケースがあります。例として、コンビニなどでは、朝のコーヒーに対する併売対象SKUの分布が、性別により大きく特徴量を決定づけることが分かってきているため、合わせて学習対象のデータについて、分布を時間帯や性別(或いは、商材によっては他の属性)で分けるなどの目的設定が必要になるでしょう。こう言った要素が分析の着眼点を鍛えるポイントや醍醐味になったりします。

 マーケットバスケット分析での評価指標(KPI)としては、主に支持度、確信度、リフト値が挙げられます。それぞれの特徴と解釈を整理すると表 2のようになります。

表2 アソシエーションルールと評価指標
  評価指標 説明
1 前提確率 全体の中でXを含むトランザクションの比率。Xは条件であるため、内部には複数アイテムやSKUを保持可能。
2 支持度
(Support, 同時確率)
全体の中で X と Y を含むトランザクションの比率。つまりその併売ルールの出現率を表す。
3 確信度
(Confidence, 条件付き確率)
X を含むトランザクションのうち、Y を含む確率。注意として、Xは必ずしも単品アイテムやSKUを表現している訳ではなく、条件と読み替えて複数商品の場合もある。このため、ある意味前提条件部と言い換えることもできる。確信度が高いほど、その前提条件において結論づけられる対象併売ルールの結びつきが強いことが分かる。
確信度の高いルール = 良いルール。
4 リフト値
(Lift, 改善率)
確信度を前提確率で割ったもの。一般には1以上であれば有効なルールとみなされる。X を買って Y も買う確率は普通に Y が買われる確率の何倍であるか。つまりリフト値が極端に低い場合、意味のあるルールとは言えなくなる。例えば、筆者(工藤)の娘が通う幼稚園では、給食の組合せを事前にウェブから複数選択するようになっているが、水という選択肢があるものの、全ての親が必須項目に近い形で選択するようデフォルト値がセットされる仕様になっている。(外したい場合は、連絡フォームから園へ対して明示的な除外理由が必要。)このようなケースで水との併売が云々と言っても、意味がない分析結果になるのは容易にお分かりいただけるだろう。

※この続きは、会員の方のみお読みいただけます(登録無料)。


※この続きは、会員の方のみお読みいただけます(登録無料)。


関連リンク

著者プロフィール

  • 工藤 卓哉 (クドウ タクヤ)

    Accenture Data Science Center of Excellence アクセンチュア アナリティクス 日本統括 マネジング・ディレクター 慶應義塾大学を卒業しアクセンチュアに入社。コンサルタントとして活躍後、コロンビア大学国際公共政策大学院で学ぶため退職。同大学...

  • 保科 学世(ホシナ ガクセ)

    アクセンチュア株式会社 デジタル コンサルティング本部 マネジング・ディレクター 慶應義塾大学大学院理工学研究科博士課程修了 理学博士。アクセンチュアにてAFS[Accenture Fulfillment Service]、ARS[Accenture Recommend Serv...

  • 佐伯 隆(サエキ タカシ)

    アクセンチュア株式会社 デジタル コンサルティング本部 アクセンチュア アナリティクス シニア・マネジャー  アクセンチュア アナリティクスにおいて、金融機関の合併に伴うデータ統合管理方針策定、通信事業者向けのビッグデータを活用したマーケティング促進システムの構築、公益事業会社向けデータ...

  • 飯澤 拓 (イイザワ ヒラク)

    アクセンチュア株式会社 デジタル コンサルティング本部 シニア・マネジャー  福島大学 経済学部卒業。 SAPなどを活用した大規模基幹システム開発から、ビッグデータを取り扱う分析基盤に至るまで、インフラ・アーキテクチャの設計と実装を専門とする。近年は通信事業者における位置情報データ活用プロジェ...

  • 平村 健勝 (ヒラムラ タケカツ)

    アクセンチュア株式会社 デジタル コンサルティング本部 コンサルタント  東京工業大学大学院 社会理工学研究科修士課程修了、アクセンチュア入社。 通信、メディア業界を中心としたシステム導入、新規サービス企画、設計、構築およびプロジェクト管理を手がける。プライベートではR言語のアドオンパッケー...

バックナンバー

連載:意志決定のためのデータサイエンス講座

もっと読む

All contents copyright © 2007-2019 Shoeisha Co., Ltd. All rights reserved. ver.1.5