相関関係と散布図
分析対象として2種類のデータ(変数)がある場合、2つの変数の間の相関関係には以下の3つのパターンが考えられます。
- 変数間に正の関係(一方が増加すれば他方も増加する)がある=正の相関
- 変数間に負の関係(一方が増加すれば他方は減少する)がある=負の相関
- 変数間は無関係=無相関
このような相関関係を分析するのに最適なグラフが散布図です。散布図は2つの変数を横軸と縦軸にプロットしたグラフです。散布図を見れば2つの変数の間にある相関関係を読み取ることができます。
散布図によるデータ分析には、もう一つ重要な要素があります。それは外れ値を見つけることです。正または負の相関が示されている散布図上から、明らかにそれらの傾向から外れている値を見つけることで、問題点を発見することができます。