散布図(QC7つ道具)

シェアする

散布図とは

2つの変数の間の関係を見るために、縦軸と横軸に目盛りを設けてデータをプロット(打点)した図です。 2つの変数にはどのような関係があるか、一方が増えるともう一方はどのように変化するのか、一方が減るともう一方はどのように変化するのか、散布図から読みとることができます。

たとえば、

  • ヒトの身長と体重
  • ヒトの親と子の身長
  • 数学テストの得点と英語テストの得点

などです。ヒトは身長が高いほど体重も重くなる傾向があるでしょう。親の背が高ければ遺伝的に子の背も高くなる傾向にあるでしょう。

ここに10人の国語のテスト、英語のテストの結果があります。この2つの科目のテストの得点に、 どのような関係があるのか散布図で見てみましょう。

10人の国語の得点、英語の得点

sanpuzuhyou1

ゴトウ君の得点を見てみましょう。国語は50点、英語は40点です。横軸を国語の得点とし、縦軸を英語の得点として、その2つが交わる箇所に点を打ちます。

☆ゴトウ君の点数を打点

sanpuzu1

次にコヤブ君の国語得点80点と英語の得点70点もプロットします。

☆コヤブ君の点数を打点

sanpuzu2

この作業を繰り返し、10人の国語の得点と英語の得点をプロットしていくと、下のような散布図が完成します。

☆散布図 完成

sanpuzu3

散布図を見ると、打点が右肩上がりになっており、国語の得点が高いほど、英語の得点も高くなる関係が見られます。このように一方の値が大きければ、もう一方の値も大きくなる傾向があることを、

「xとyの間に正の相関がある」といいます。

逆に一方の値が大きくなると、もう一方の値が小さくなる傾向があれば、

「xとyの間に負の相関がある」といいます。

相関の言い表し方

一方をxとし、もう一方をyとしたときに、相関関係について下記のように言い表します。番号をふった図も合わせて見てください。

(1) xが大きくなれば、yも直線的に大きくなる場合、「xとyの間に強い正の相関がある」
(2) xが大きくなれば、yも大きくなる傾向がある場合、「xとyの間に正の相関がある」
(3) xが大きくなれば、yも大きくなるわけでもない場合(散布図上にバラバラに打点されている)、「相関が無い」
(4) xが大きくなれば、yも小さくなる傾向がある場合、「xとyの間に負の相関がある」
(5) xが大きくなれば、yも直線的に小さくなる場合、「xとyの間に強い負の相関がある」

sanpuzu4

これらの関係の度合を示す数値として、相関係数があります。 相関係数は、-1 ~ 0 ~ +1の間の値をとります。正の相関があるとプラスの値、負の相関があると相関係数はマイナスになります。

正の相関が強いほど相関係数は+1に近づき、(1)のような図になります。(1)の図は相関係数0.9程であり、相関係数=1の場合には、打点が完全に直線になります。正の相関が弱くなると0に近づいていき、0だと全く相関が無い状態、つまり無相関の状態です。(4)のような負の相関ではマイナスの値をとり、打点が完全な直線になると-1となります。

ちなみに、先ほど散布図を書いた10人のテスト結果で、国語の得点と英語の得点の相関係数は、0.81です。

sanpuzu5

相関係数は0.81はなかなかの強い相関であるといえます。※ただし10人だけのデータで精度が高くないですから、実際に活用する場合にはもっとたくさんデータ(30個以上)を集めた方がよいです。

ちなみに、グラフ上での打点の集まりの傾きは、相関の強さ・弱さに関係がありません。バラつきが小さく直線的になっているかなっていないかが、相関の強弱です。

ためしに、下図のように縦軸の目盛りを200までにしてみたり、グラフを正方形から長方形に変えるなどすれば、打点上に引いた線の傾きは簡単に変わります。傾きは変わったとしても、当然ながら得点と相関係数は変わっていません。傾きと相関係数は関係がないことがわかります。