【第六回】クラスタ分析:グループ化、セグメンテーションから戦略を練る

工藤卓哉 [著] / 保科学世[著] / 佐伯　隆[著] / 飯澤　拓 [著] / 余東明 [著]

更新日: 2015/07/06
公開日: 2015/05/11

通知

　アクセンチュアの全世界組織であるアクセンチュアアナリティクスチームが贈る「意思決定のためのデータサイエンス講座」。今回より2回にわたって、クラスタ分析を紹介していきます。初回はクラスタ分析のビジネスにおける応用例、その分析手法の概要と分析実施時の心構えについて、次回はRによるクラスタ分析の実施方法を、実データを使って説明します。

通知

1. クラスタ分析とは

　クラスタ分析（別名：クラスタリング）は、異なる特徴を持っているデータの集合において、特徴の類似性が高いデータをグループ化する機械学習のサブセットの一つで、データマイニング手法です。クラスタ分析を行うことで、個々のデータはそれぞれの特徴に基づいて複数のグループのいずれかに分類され、結果として同じような特徴を持つ（類似度が高い）データのグループが1つのクラスタとして識別されます。つまり、1つのクラスタ内のデータが同質になり、かつそれぞれのクラスタが異質になるように分類することが、本手法の目的となります。

　データを分類する機械学習の手法としては、クラスタ分析（Clustering）と同様にクラス分類（Classification）がよく知られていますが、クラスタ分析とクラス分類の大きな違いは「教師データの有無」にあります。教師データとは分析モデルをコンピュータに学習させるため、人間の視点で作成した見本データのことです。この定義に従うと、少しだけ違和感が残る方もいるかも知れません。

　前回紹介したディープラーニングは、上述した特徴の抽出プロセスを完全に機械化する為、「人間の視点」というものが存在しません。ディープラーニングを除くクラス分類問題時は、データ収集タスクにおいては、ターゲット変数に対して正解付のラベリングという恣意性の入りやすい事前準備を実施する必要があることを少しだけ補足しておきます。クラス分類は教師ありの分析手法であり、事前に目的のカテゴリへ分類済みの教師データから分類の基準を見つけ出し、その基準に基づいて未分類データのグループ分けを行う手法です。

　それに対して、クラスタ分析は教師なしの分類手法であり、分類されていないデータの特徴を表す属性値からデータ間の類似性を探し出し、それを評価することでグループ分けを行います。

　クラスタ分析は、目的のカテゴリを事前に設定するクラス分類と比較して分類の客観性が高いと言えますが、データをいくつのグループに分類してよいか、各グループがどのような特徴、性質を持っているかは、分析者がクラスタ分析の結果と目的に応じて考察と解釈を行う必要があります。

　また、考察と解釈を行うだけでは実務に耐えうる解析結果にはなりません。実務の世界では考察と解釈に応じた施策を実施することで、初めて解析という行為に意味を持たせることができるからです。ここを忘れる解析担当者があまりに多いのも事実でしょう。

2. ビジネスにおける応用例

　クラスタ分析は、データの特徴と構造を探索的に捉える有用な分析手法であり、天文学、考古学、遺伝学等の様々な研究分野において活用されています。ビジネスの分野においても、マーケティングの戦略立案をはじめ、クラスタ分析は多岐にわたって活用されています。ここからはマーケティングにおけるクラスタ分析の代表的な3つの活用例をご紹介しながら、実務におけるクラスタ分析の特徴を確認しましょう。

(1) 市場細分化に基づくターゲット市場の選定

　企業の製品市場では、顧客がそれぞれ異なる属性（性別・年齢・趣味・嗜好等）を持っています。顧客をその属性に基づいてグループ化し、自社製品に見合ったグループの顧客に対して効果的なマーケティング施策を展開していくのが、市場細分化の基本的な考え方となります。

　顧客市場を細分化するプロセスをセグメンテーションと言い、セグメンテーションにより細分化された顧客グループをセグメントと言います。

　ロイヤルカスタマーや優良顧客の定義など、最もわかりやすいのはクレジットカード会社に見られるカード利用額に応じた顧客セグメンテーションでしょう。プラチナメンバー、ゴールドメンバー等は、普通会員と差別化されたサービスを享受できるように設計されていますが、まさにこの市場細分化の概念に基づく施策です。

　セグメンテーションの実施にはクラスタ分析の手法がよく利用されます。クラスタ分析でセグメンテーションを行う場合、顧客のどの属性をセグメンテーション変数として使うのがよいかは、分析者が分析の目的に合わせて選別する必要があります。例えば、外国旅行者向けのキャンペーンを企画する場合、国籍、言語、購買総額等の複数の顧客属性に着目し、市場の細分化とターゲット市場の選定を行うことになるでしょう。

　現代マーケティングの第一人者として知られているフィリップ・コトラー氏は、ベストセラーとなった著書「マーケティング原理」において、顧客市場の主要なセグメンテーション変数について以下のように記述しています。

表 1：顧客市場の主要セグメンテーション変数
#	セグメンテーション変数	顧客属性例
1	ジオグラフィック（地理的変数）	国、地域、州、郡、市、近隣地域、人口密度（都市、郊外、農村）、気候
2	デモグラフィック（人口統計学的変数）	年齢、ライフサイクルステージ、性別、収入、職業、教育、宗教、民族、世代
3	サイコグラフィック（心理的変数）	社会階級、ライフスタイル、性格
4	ビヘイビアル（行動変数）	利用シーン、訴求価値、ユーザステータス、利用頻度、ロイヤルティステータス

出典：「Principles of Marketing (15th Edition), Global Edition」の「Chapter 7 Customer-Driven Marketing Strategy」より引用・和訳

　従来の分析においては、顧客属性として表1の「ジオグラフィック」と「デモグラフィック」がよく使われていました。しかし、ここ数年ビッグデータ処理基盤やデジタルマーケティングの進化とともに、「サイコグラフィック」、「ビヘイビアル」の顧客属性が分析可能となり、重要視されつつあります。「サイコグラフィック」、「ビヘイビアル」の顧客属性に着目することにより、顧客個体に対する理解がより深まり、マーケティング施策の効率・効果を改善させることが可能になってきています。

(2) 製品ポジショニングによる差別化戦略の策定

　企業が新製品の企画・開発、市場投入にあたってのキャンペーンを行う際には、他社の競合製品の調査が不可欠となります。競合製品との比較によって、自社製品の圧倒的な強みや他社製品の欠点を可視化することで、他社製品に対する優位性に着目して製品のポジションを確立していくことが可能になります。

　このようなケースでは、必要な競合製品の属性を使用したクラスタ分析を行うことで、競合製品との関係を明確にすることが可能です。通常同じクラスタに分類された製品は直接の競合関係にあるので、当該製品に対する差別化戦略を考える必要があります。また、クラスタ分析により、どの競合も参入していない空白マーケットを発見し、新規市場開拓のオポチュニティに繋げることもあります。

(3) テストマーケットにおけるマーケティング施策の評価

　企業は売上げ拡大のため、新規製品の開発・販売や製品キャンペーンの展開等、様々なマーケティング施策を企画します。しかし、必ずしもすべての施策が成功するとは限らないことから、施策の全面的な展開を行う前に、まず少数の顧客からなるテストマーケットにおいて施策のテストを行い、事前評価を行うのが一般的です。

　テストマーケットを決定するには、全国のマーケットからランダムに抽出したり、個人的な経験に基づいて選別したりすることも考えられますが、類似性が高いマーケットを選んでしまうことや、未開拓の重要なマーケットを見落としてしまう可能性があります。テストの有効性を保証するために、テストマーケットを決定する前に、製品の売れ行きに影響が強いマーケット属性（例えば、年齢構造・収入構成等）に基づいて、事前にマーケットのクラスタ分析を実施するアプローチが有効です。

　クラスタ分析により、各マーケットがその属性の特徴に基づいてグループ化されるので、形成された各マーケットグループ（クラスタ）よりテストマーケットを選出すれば、テストマーケット間の異質性とテストの網羅性を担保し、効率よく効果的なマーケットテストが実現可能になります。

　ここまでは「顧客市場の細分化」、「製品ポジショニング」、「テストマーケットの選択」における利用シーンを通して、クラスタ分析のビジネス応用例の概要を説明しました。この例から分かるように、クラスタ分析は探索的な分析手法であり、分類の基準を事前に設けなくても異なる種類のデータを複数の特徴量に基づいて客観的に分類することができます。

　ただし、クラスタ分析のインプットとなる特徴量が分析目的を正確に説明できない場合は、正しい分析結果のアウトプットを期待したり、有効な施策に繋げることができません。クラスタ分析を行う際には、分析目的を明確にしたうえで、分析目的をサポートできる特徴量を慎重に選定しましょう。

会員登録無料すると、続きをお読みいただけます

新規会員登録無料のご案内

・全ての過去記事が閲覧できます
・会員限定メルマガを受信できます
・翔泳社の本が買える！
500円分のポイントをプレゼント

メールバックナンバー

新規会員登録無料

次のページ
3. クラスタ分析の手法

この記事は参考になりましたか？

広告を読み込めませんでした

広告を読み込み中...

印刷用を表示

意志決定のためのデータサイエンス講座連載記事一覧: 【第九回】経路探索(後編) R言語と地図データによる実行

【第八回】経路探索(前編) アルゴリズムとビジネスへの適用

【第七回】クラスタ分析 (後編)　「R」を使ったクラスタ分析

もっと読む

この記事の著者: 工藤卓哉（クドウタクヤ）

Accenture
Data Science Center of Excellence
アクセンチュアアナリティクス日本統括
マネジング・ディレクター慶應義塾大学を卒業しアクセンチュアに入社。コンサルタントとして活躍後、コロンビア大学国際公共政策大学院で学ぶため退職。同...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事; 保科学世（ホシナガクセ）

アクセンチュア株式会社デジタルコンサルティング本部
マネジング・ディレクター
慶應義塾大学大学院理工学研究科博士課程修了理学博士。アクセンチュアにてAFS［Accenture Fulfillment Service］、ARS［Accenture Recommend Service］など、アナリ...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事; 佐伯　隆（サエキタカシ）

アクセンチュア株式会社デジタルコンサルティング本部
アクセンチュアアナリティクスシニア・マネジャー　
アクセンチュアアナリティクスにおいて、金融機関の合併に伴うデータ統合管理方針策定、通信事業者向けのビッグデータを活用したマーケティング促進システムの構築、公益事業会社向けデータ...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事; 飯澤　拓（イイザワヒラク）

アクセンチュア株式会社　デジタルコンサルティング本部シニア・マネジャー　
福島大学経済学部卒業。 SAPなどを活用した大規模基幹システム開発から、ビッグデータを取り扱う分析基盤に至るまで、インフラ・アーキテクチャの設計と実装を専門とする。近年は通信事業者における位置情報データ活用プロジェクトや、...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事; 余東明（ヨトウメイ）

アクセンチュア株式会社デジタルコンサルティング本部コンサルタント
アクセンチュアアナリティクスにおいて、クラウド・モビリティ・センサー等の新技術を活かした並列分散処理基盤の設計・構築とデータ分析に携わっている。通信・メディア・ハイテク業界を中心に、企画・設計から構築・運用まで一貫した業務経験があ...

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事