1. クラスタ分析とは
クラスタ分析(別名:クラスタリング)は、異なる特徴を持っているデータの集合において、特徴の類似性が高いデータをグループ化する機械学習のサブセットの一つで、データマイニング手法です。クラスタ分析を行うことで、個々のデータはそれぞれの特徴に基づいて複数のグループのいずれかに分類され、結果として同じような特徴を持つ(類似度が高い)データのグループが1つのクラスタとして識別されます。つまり、1つのクラスタ内のデータが同質になり、かつそれぞれのクラスタが異質になるように分類することが、本手法の目的となります。
データを分類する機械学習の手法としては、クラスタ分析(Clustering)と同様にクラス分類(Classification)がよく知られていますが、クラスタ分析とクラス分類の大きな違いは「教師データの有無」にあります。教師データとは分析モデルをコンピュータに学習させるため、人間の視点で作成した見本データのことです。この定義に従うと、少しだけ違和感が残る方もいるかも知れません。
前回紹介したディープラーニングは、上述した特徴の抽出プロセスを完全に機械化する為、「人間の視点」というものが存在しません。ディープラーニングを除くクラス分類問題時は、データ収集タスクにおいては、ターゲット変数に対して正解付のラベリングという恣意性の入りやすい事前準備を実施する必要があることを少しだけ補足しておきます。クラス分類は教師ありの分析手法であり、事前に目的のカテゴリへ分類済みの教師データから分類の基準を見つけ出し、その基準に基づいて未分類データのグループ分けを行う手法です。
それに対して、クラスタ分析は教師なしの分類手法であり、分類されていないデータの特徴を表す属性値からデータ間の類似性を探し出し、それを評価することでグループ分けを行います。
クラスタ分析は、目的のカテゴリを事前に設定するクラス分類と比較して分類の客観性が高いと言えますが、データをいくつのグループに分類してよいか、各グループがどのような特徴、性質を持っているかは、分析者がクラスタ分析の結果と目的に応じて考察と解釈を行う必要があります。
また、考察と解釈を行うだけでは実務に耐えうる解析結果にはなりません。実務の世界では考察と解釈に応じた施策を実施することで、初めて解析という行為に意味を持たせることができるからです。ここを忘れる解析担当者があまりに多いのも事実でしょう。
2. ビジネスにおける応用例
クラスタ分析は、データの特徴と構造を探索的に捉える有用な分析手法であり、天文学、考古学、遺伝学等の様々な研究分野において活用されています。ビジネスの分野においても、マーケティングの戦略立案をはじめ、クラスタ分析は多岐にわたって活用されています。ここからはマーケティングにおけるクラスタ分析の代表的な3つの活用例をご紹介しながら、実務におけるクラスタ分析の特徴を確認しましょう。
(1) 市場細分化に基づくターゲット市場の選定
企業の製品市場では、顧客がそれぞれ異なる属性(性別・年齢・趣味・嗜好等)を持っています。顧客をその属性に基づいてグループ化し、自社製品に見合ったグループの顧客に対して効果的なマーケティング施策を展開していくのが、市場細分化の基本的な考え方となります。
顧客市場を細分化するプロセスをセグメンテーションと言い、セグメンテーションにより細分化された顧客グループをセグメントと言います。
ロイヤルカスタマーや優良顧客の定義など、最もわかりやすいのはクレジットカード会社に見られるカード利用額に応じた顧客セグメンテーションでしょう。プラチナメンバー、ゴールドメンバー等は、普通会員と差別化されたサービスを享受できるように設計されていますが、まさにこの市場細分化の概念に基づく施策です。
セグメンテーションの実施にはクラスタ分析の手法がよく利用されます。クラスタ分析でセグメンテーションを行う場合、顧客のどの属性をセグメンテーション変数として使うのがよいかは、分析者が分析の目的に合わせて選別する必要があります。例えば、外国旅行者向けのキャンペーンを企画する場合、国籍、言語、購買総額等の複数の顧客属性に着目し、市場の細分化とターゲット市場の選定を行うことになるでしょう。
現代マーケティングの第一人者として知られているフィリップ・コトラー氏は、ベストセラーとなった著書「マーケティング原理」において、顧客市場の主要なセグメンテーション変数について以下のように記述しています。
# | セグメンテーション変数 | 顧客属性例 |
---|---|---|
1 |
ジオグラフィック (地理的変数) |
国、地域、州、郡、市、近隣地域、人口密度(都市、 郊外 、農村)、気候 |
2 |
デモグラフィック (人口統計学的変数) |
年齢、ライフサイクルステージ、性別、収入、職業、教育、宗教、民族、世代 |
3 |
サイコグラフィック (心理的変数) |
社会階級、ライフスタイル、性格 |
4 |
ビヘイビアル (行動変数) |
利用シーン、訴求価値、ユーザステータス、利用頻度、ロイヤルティステータス |
出典: 「Principles of Marketing (15th Edition), Global Edition」の「Chapter 7 Customer-Driven Marketing Strategy」より引用・和訳
従来の分析においては、顧客属性として表1の「ジオグラフィック」と「デモグラフィック」がよく使われていました。しかし、ここ数年ビッグデータ処理基盤やデジタルマーケティングの進化とともに、「サイコグラフィック」、「ビヘイビアル」の顧客属性が分析可能となり、重要視されつつあります。「サイコグラフィック」、「ビヘイビアル」の顧客属性に着目することにより、顧客個体に対する理解がより深まり、マーケティング施策の効率・効果を改善させることが可能になってきています。
(2) 製品ポジショニングによる差別化戦略の策定
企業が新製品の企画・開発、市場投入にあたってのキャンペーンを行う際には、他社の競合製品の調査が不可欠となります。競合製品との比較によって、自社製品の圧倒的な強みや他社製品の欠点を可視化することで、他社製品に対する優位性に着目して製品のポジションを確立していくことが可能になります。
このようなケースでは、必要な競合製品の属性を使用したクラスタ分析を行うことで、競合製品との関係を明確にすることが可能です。通常同じクラスタに分類された製品は直接の競合関係にあるので、当該製品に対する差別化戦略を考える必要があります。また、クラスタ分析により、どの競合も参入していない空白マーケットを発見し、新規市場開拓のオポチュニティに繋げることもあります。
(3) テストマーケットにおけるマーケティング施策の評価
企業は売上げ拡大のため、新規製品の開発・販売や製品キャンペーンの展開等、様々なマーケティング施策を企画します。しかし、必ずしもすべての施策が成功するとは限らないことから、施策の全面的な展開を行う前に、まず少数の顧客からなるテストマーケットにおいて施策のテストを行い、事前評価を行うのが一般的です。
テストマーケットを決定するには、全国のマーケットからランダムに抽出したり、個人的な経験に基づいて選別したりすることも考えられますが、類似性が高いマーケットを選んでしまうことや、未開拓の重要なマーケットを見落としてしまう可能性があります。テストの有効性を保証するために、テストマーケットを決定する前に、製品の売れ行きに影響が強いマーケット属性(例えば、年齢構造・収入構成等)に基づいて、事前にマーケットのクラスタ分析を実施するアプローチが有効です。
クラスタ分析により、各マーケットがその属性の特徴に基づいてグループ化されるので、形成された各マーケットグループ(クラスタ)よりテストマーケットを選出すれば、テストマーケット間の異質性とテストの網羅性を担保し、効率よく効果的なマーケットテストが実現可能になります。
ここまでは「顧客市場の細分化」、「製品ポジショニング」、「テストマーケットの選択」における利用シーンを通して、クラスタ分析のビジネス応用例の概要を説明しました。この例から分かるように、クラスタ分析は探索的な分析手法であり、分類の基準を事前に設けなくても異なる種類のデータを複数の特徴量に基づいて客観的に分類することができます。
ただし、クラスタ分析のインプットとなる特徴量が分析目的を正確に説明できない場合は、正しい分析結果のアウトプットを期待したり、有効な施策に繋げることができません。クラスタ分析を行う際には、分析目的を明確にしたうえで、分析目的をサポートできる特徴量を慎重に選定しましょう。