Excelには、様々な関数が用意されていますが、その中でも、データ分析にもっとも力を発揮する機能が統計関数です。Excel2010の場合、全部でおおよそ100種類の統計関数が存在しますが、この連載では、基本的な統計関数の利用方法とそれらを利用したデータ分析の3つの例(来客数分析、発注点計画、販売数量予測)を説明します。第1回(統計関数編)の今回は、統計関数の基本操作について説明します。なお、この連載では、Excel2010を使用しています。
基本的な統計関数(平均と度数分布)
平均はデータ分析のもっとも基本的な方法といってもよいでしょう。平均を求めるにはAVERAGE関数を利用します。

しかし、平均で求められる結果は、データに含まれる外れ値のせいで実態を正しくとらえていないことがあります。このような誤りを防ぐ方法の一つが、データの度数分布を見て外れ値の存在を見抜くことです。度数分布とは、データの値を等間隔の階級に分け、それぞれの階級に含まれるデータの数を計算したもののことです。度数分布を求めるにはFREQENCY関数を利用します。

FREQENCY関数で求められた度数分布から外れ値の存在を発見できる場合があります。
上の例でいえば、ひとつだけ飛び抜けて大きな値(150)があるため、全体の平均(85.6)を大きくしていることになります。このような外れ値を含まないデータで計算される平均がより実態に近いものといえます。外れ値を除外したデータの平均(81.6)を求めるにはAVERAGEIF関数を利用します。

FREQENCY関数で求められた度数分布を棒グラフにしたものをヒストグラムと呼びます。ヒストグラムの形状は、外れ値を含まないデータの場合、平均の値を中心として左右対称の山の形になります。統計学では、これを正規分布と呼びます。この正規分布の横軸を確率変数と呼び、縦軸は山の面積を1とした場合に確率変数がその値となる確率となります。

ヒストグラムを作成して度数分布を見たときに、山の形が正規分布に従っていない場合、外れ値の存在を疑う必要があります。
この記事は参考になりましたか?
- この記事の著者
-
平井 明夫(ヒライ アキオ)
株式会社エムキューブ・プラスハート 事業企画コンサルタントDEC、コグノス、オラクル、IAFコンサルティングにおいて20年以上にわたり、ソフトウエア製品やITサービスのマーケティング、事業企画・運営に携わる。現在は、事業企画コンサルタントとしてIT企業の新規事業立上げ、事業再編を支援するかたわら、デ...
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア