SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

直近開催のイベントはこちら!

EnterpriseZine編集部ではイベントを随時開催しております

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

意志決定のためのデータサイエンス講座

【第二回】アソシエーション分析:購買分析からレコメンデーション応用まで


 アクセンチュアの全世界組織であるアクセンチュア アナリティクスチームが贈る「意思決定のためのデータサイエンス講座」。第二回目となる今回は、購買分析に効くアソシエーション分析を紹介します。

 

購買分析に効く!アソシエーション分析

 第一回では、人工知能プログラミングの概要から入りました。今回は二回目であり、具体論の初回ということで、皆さんが日々の生活で少なからずお世話になっているであろう身近なデータを扱うことで、機械学習に対する親近感を持っていただけたらと考えて、まずはコンビニエンスストアなど商品明細POSデータに代表されるトランザクションデータを扱っていきたいと思います。できる限り実際の状況を意識しながら、探索問題の一つであるアプリオリアルゴリズムの応用、アソシエーション分析の基礎について解説していきます。

 アソシエーション分析(別名:マーケットバスケット分析)は、90年代に考案された分析手法で、代表的なものにRakesh Agrawal氏らが1993年に執筆した論文「Fast algorithms for mining association rules」 [Agrawal, R.; Imieliński, T.; Swami, A.]があり、トランザクションデータの規則性を抽出する実践的方法論が紹介されています。この分析手法ですが、売り上げ向上施策によく使われているのはご存知かもしれません。蓄積された顧客毎の取引データを分析し、併売の関係性が強い事象の組合せやその割合、統計的に見て強い関係を持つ事象間の関係(ルール)を抽出するデータマイニング手法で、「商品 A を購入した人は、商品 B も購入する確率が高い」という法則性(アソシエーションルール:指標詳細については後述)を見つけ出す分析手法です。

 アソシエーション分析の活用例で有名なものとしては、小売店における前述したトランザクション形式の代表例であるPOS データを利用した分析で、同時に購入されている確率が高い商品を明らかにし、その上で、店舗別のレイアウト設計、棚割りや商品配置の最適化、顧客別のクロスセル、アップセルや価格最適化に活用するケースが挙げられます。
 

 例えば、スーパーマーケットなどの小売店舗におけるPOSレジで支払いと同時に次回利用可能な動的なクーポンが発行されるケースがありますが、このようにトップライン増強策としての販売促進に利用されている実例を実務の世界でも良く見ます。
 

 飲食店においては追加注文のレコメンデーションなどクロスセルへの活用などが可能となります。既存顧客に対し、より上位の、高価なものを購入してもらうことをアップセル、いつも購入している商品やサービスに加え、関連する別の商品も推薦して、売上につなげることをクロスセルといいますが、アソシエーション分析は、このクロスセルに高い頻度で活用されます。
 

 EC サイトでは、購買履歴を分析し、顧客毎に最適化された商品が並んだトップページを提供することで顧客の利便性と顧客満足度(CS)の向上に貢献できます。また、購買履歴だけでなくウェブサイトへのアクセスログを用いて、ページ閲覧履歴の解析などにも応用可能です。

 各業種・業態別に見たアソシエーション分析の活用対象は表 1のようになります。

表1 アソシエーション分析の活用対象
業種/業態 分析 活用により得られる効果(例)
GMS(総合スーパーマーケット)
CVS(コンビニエンススストア)等
流通小売業全般
同時購入商品の組合せ
上記の店舗間比較
店舗内での商品陳列の最適化
購買動機の把握 
店舗間での顧客嗜好の比較
新規出店時の地理的特徴の把握
eコマース・デジタルコンテンツ産業 IDに紐付く過去の累積
購買履歴
サイト内のページ閲覧履歴
顧客毎にカスタマイズされたメールマガジン、インターネット広告、トップページによるコンバージョン率の向上
通信サービス・工業製品 製品本体とオプション製品(サービス)の組合せ オプション製品(サービス)同士の組合せ 携帯電話、プロバイダの料金プラン、付加オプションサービスの提案
オプション商品同士のセット販売による顧客インセンティブ
外食産業 トッピングメニューの組合せ
食べ物・飲み物・サイドメニューの組合せ
追加オーダーのレコメンド
新商品、セットメニューの考案
(時系列比較による)顧客動向の調査
金融サービス 金融商品の購入状況

投資対象銘柄の提案
顧客の嗜好、選択基準の把握

 このようなアソシエーションルールを発見する手法としては、アプリオリ(Apriori)アルゴリズムが広く知られています。アプリオリアルゴリズムでは、全アイテム(商品)の組合せに対して、ある商品Aとある商品Bが同時に購入される確率(支持度)を求め、さらにある商品Aに関するルールのうち、商品Bを含んでいる確率(確信度)を求めることで意味のあるルールを導き出します。つまり前者は特定の併売パターンの全体に占める割合、後者が特定の併売パターンでの結びつきの強さを表します。また、アプリオリアルゴリズムの他には、FP-Treeと呼ばれるツリー構造のデータモデルを利用することで高速化を図ったFP-Growthアルゴリズムがあります。系列性を考慮したアソシエーション分析(例えば、商品Aの後に商品Bを購入する確率と商品Bの後に商品Aを購入する確率を別として扱う)としては、SPADEアルゴリズムが知られています。

アソシエーションルールと評価指標

 アソシエーションルールは、X⇒Y(XならばY)の形式で示されます。この X を条件部、Y を結論部と呼びます。典型的な例としては、シャンプー⇒リンス(シャンプーならばリンス)、ビール⇒枝豆(ビールなら枝豆)などが想像できそうですが、レタス&ハム⇒コッペパン(レタスとハムならばコッペパン)のような条件部に複数の商品を仮定することも可能です。

 多くの場合、POSデータから得られるデータはSKU(最小管理単位; Stock Keeping Unit)単位で記録されますが、SKU毎に分析するとアイテム数が多すぎて有用な結果が得にくいため、グループ化の工夫が必要です。そしてグループ化の単位を「分析したいとしている」単位でグループ化することが重要です。このためにコード体系を整理する工程が必要となります。

 ビールに例えると、「食料品>飲料>アルコール飲料>ビール>ABC(ブランド)>ABCビール>ABCビール(350ml缶) 」など、どのレイヤーでグループ化を行うかを分析で明らかにしたい仮説と目的から検討し、設定する必要があります。ここはマーケターの分析の着眼点や目的が強く要求される領域になります。

 例えば、対象となる併売SKUの中に、同じブランドがあっても、パッケージングのボリュームに対する嗜好性を取りたいという特殊なケースもあるでしょう。事実、これまでのプロジェクトで、清涼飲料水1本あたりの消費量に対する嗜好性が時間別(午前と午後等)に変化する傾向にあることがこれまでのプロジェクトを通じた分析の経験上も分かってきていますから、そうした分析には同じ味やブランドでもSKUに容量ラベルがカテゴリ分けの軸に入っていることが重要になるでしょう。

 また、純粋に併売の傾向を顧客セグメント別に把握していきたい場合、属性情報による分布の絞り込みやグループ分けも重要になるケースがあります。例として、コンビニなどでは、朝のコーヒーに対する併売対象SKUの分布が、性別により大きく特徴量を決定づけることが分かってきているため、合わせて学習対象のデータについて、分布を時間帯や性別(或いは、商材によっては他の属性)で分けるなどの目的設定が必要になるでしょう。こう言った要素が分析の着眼点を鍛えるポイントや醍醐味になったりします。

 マーケットバスケット分析での評価指標(KPI)としては、主に支持度、確信度、リフト値が挙げられます。それぞれの特徴と解釈を整理すると表 2のようになります。

表2 アソシエーションルールと評価指標
  評価指標 説明
1 前提確率 全体の中でXを含むトランザクションの比率。Xは条件であるため、内部には複数アイテムやSKUを保持可能。
2 支持度
(Support, 同時確率)
全体の中で X と Y を含むトランザクションの比率。つまりその併売ルールの出現率を表す。
3 確信度
(Confidence, 条件付き確率)
X を含むトランザクションのうち、Y を含む確率。注意として、Xは必ずしも単品アイテムやSKUを表現している訳ではなく、条件と読み替えて複数商品の場合もある。このため、ある意味前提条件部と言い換えることもできる。確信度が高いほど、その前提条件において結論づけられる対象併売ルールの結びつきが強いことが分かる。
確信度の高いルール = 良いルール。
4 リフト値
(Lift, 改善率)
確信度を前提確率で割ったもの。一般には1以上であれば有効なルールとみなされる。X を買って Y も買う確率は普通に Y が買われる確率の何倍であるか。つまりリフト値が極端に低い場合、意味のあるルールとは言えなくなる。例えば、筆者(工藤)の娘が通う幼稚園では、給食の組合せを事前にウェブから複数選択するようになっているが、水という選択肢があるものの、全ての親が必須項目に近い形で選択するようデフォルト値がセットされる仕様になっている。(外したい場合は、連絡フォームから園へ対して明示的な除外理由が必要。)このようなケースで水との併売が云々と言っても、意味がない分析結果になるのは容易にお分かりいただけるだろう。

次のページ
Rのarulesパッケージを使ってみよう

この記事は参考になりましたか?

  • Facebook
  • Twitter
  • Pocket
  • note
関連リンク
意志決定のためのデータサイエンス講座連載記事一覧

もっと読む

この記事の著者

工藤 卓哉 (クドウ タクヤ)

Accenture
Data Science Center of Excellence
アクセンチュア アナリティクス 日本統括
マネジング・ディレクター慶應義塾大学を卒業しアクセンチュアに入社。コンサルタントとして活躍後、コロンビア大学国際公共政策大学院で学ぶため退職。同...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

保科 学世(ホシナ ガクセ)

アクセンチュア株式会社 デジタル コンサルティング本部
マネジング・ディレクター
慶應義塾大学大学院理工学研究科博士課程修了 理学博士。アクセンチュアにてAFS[Accenture Fulfillment Service]、ARS[Accenture Recommend Service]など、アナリ...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

佐伯 隆(サエキ タカシ)

アクセンチュア株式会社 デジタル コンサルティング本部
アクセンチュア アナリティクス シニア・マネジャー 
アクセンチュア アナリティクスにおいて、金融機関の合併に伴うデータ統合管理方針策定、通信事業者向けのビッグデータを活用したマーケティング促進システムの構築、公益事業会社向けデータ...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

飯澤 拓 (イイザワ ヒラク)

アクセンチュア株式会社 デジタル コンサルティング本部 シニア・マネジャー 
福島大学 経済学部卒業。 SAPなどを活用した大規模基幹システム開発から、ビッグデータを取り扱う分析基盤に至るまで、インフラ・アーキテクチャの設計と実装を専門とする。近年は通信事業者における位置情報データ活用プロジェクトや、...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

平村 健勝 (ヒラムラ タケカツ)

アクセンチュア株式会社 デジタル コンサルティング本部
コンサルタント 東京工業大学大学院 社会理工学研究科修士課程修了、アクセンチュア入社。 通信、メディア業界を中心としたシステム導入、新規サービス企画、設計、構築およびプロジェクト管理を手がける。プライベートではR言語のアドオンパッケージ開発、検索...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/6084 2015/07/06 11:27

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング