データマイニングとは、大量のデータから統計学的手法を使って意味のある相関関係やパターン、ルールなどを導き出すデータ分析手法です。
「統計学的手法を使って・・・」というと「データ分析の専門家が使う分析手法」と思われる方が多いと思いますが(実際、世の中にあるデータマイニングツールのほとんどはデータ分析の専門家向けツールなのですが)、このソリューションを用いればビジネスユーザーでも簡単にデータマイニングができるようになります。
現在、ほとんどの会社で何らかのBIシステムを導入されていると思いますが、グラフ化されたデータを見たり、クロス集計表で軸を入れ替えたりしただけでは、思う様な「気づき」を得られない事も多いと思います。そんなときにこのソリューションを使えば、データ分析の専門家の手を借りることなく、今まで誰も気づかなかったルールやパターンを見つけることができるかもしれません。
Excel でデータマイニングができるといっても、Excel自体には簡易的な分析機能は持っているものの、本格的なデータマイニングの分析エンジンは搭載されていません。本格的なデータマイニング分析を行う場合には、高度なデータマイニング分析機能を提供しているSQL Server Analysis Services(多次元モード)を利用し、クライアントツールとしてExcelを利用します。
ですので、このソリューションを利用するには事前にSQL Server Analysis Serviceを準備しておく必要があります。また、Excelには分析用アドイン(データマイニングアドイン for Excel)を以下のURLからダウンロードし、インストールする必要があります。
Microsoft® Office® 用 Microsoft® SQL Server® 2012 SP3 データ マイニング アドイン
https://www.microsoft.com/ja-jp/download/details.aspx?id=49997
データマイニングアドイン for Excelをインストールすると、下図の様にExcelのメニューバーに「データマイニング」と「分析」というツールバー(タブ)が出現します。
※「データマイニング」ツールバーを利用するには、データマイニングアドイン for Excelインストール時に、インストール対象として「Excel用データマイニングクライアント」を明示的に選択する必要があります。
※「分析」ツールバーは、スプレッドシート上に作成したテーブルを選択すると表示されます。
この2つのツールバーの違いですが、「分析」メニューは全くデータマイニングの知識を持っていなくても分析できるビジネスユーザー向けのメニューで、「データマイニング」メニューは少しデータマイニングの知識を持っている人を対象としており、細かな設定ができるようになっています。
ただし「データマイニング」メニューであっても非常に簡単に分析ができるように作ってありますので、スキルレベルに関わらず、臆することなくどんどん試されることをお勧めします。(今回は「データマイニング」メニューであっても簡単に分析ができることを理解していただく為に、後半部分ではこちらのメニューを使った分析例についてご紹介しています)
データマイニング |
若干データマイニングの知識を持っている人向けメニュー。データクリーニングやサンプリング、モデルのカスタマイズ等、SQL Server Analysis Services が提供するすべてのデータマイニングの機能が利用可能。 |
分析 |
全くデータマイニングの知識がなくても分析できるビジネスユーザー向けのメニュー。 |
※各メニューでできる分析内容の詳細については、以下のページに記載していますので、ご確認ください。
「分析」ツールバーを使ってできる分析内容
https://msdn.microsoft.com/ja-jp/library/dn282345(v=sql.120).aspx
「データマイニング」ツールバーを使ってできる分析内容
https://msdn.microsoft.com/ja-jp/library/dn282385(v=sql.120).aspx