偏差平方和と分散、偏差積和と共分散

偏差平方和と分散、偏差積和と共分散の関係について書きました。

偏差平方和と分散

まずは、偏差について。偏差は、あるデータの値から平均値の差のことです。

偏差平方和とは、各データの偏差を2乗し、足し合わせたもののことです。「偏差」は、データと平均の差、「平方」は二度掛け合わせること、「和」は足すことを示していますね。

分散を計算するときには、このプロセスを経て計算します。偏差平方和をデータの数nで割れば、分散の値が得られます。

分散の計算手順はこちらに書いています。

分散と標準偏差の意味と計算方法

偏差積和と共分散

2変数x、yのn組のデータがあったとします。たとえば、

  • A君の身長と体重
  • B君の身長と体重
  • C君の身長と体重

であったり、

  • 一昨日の気温とオデンの売上
  • 昨日の気温とオデンの売上
  • 今日の気温とオデンの売上

といったものです。

まず偏差積について。各観測データxiとxの平均値の差がxiの偏差、各観測データyiとy平均値の差がyiの偏差です。

iの偏差とyiの偏差の積を偏差積といいます。各観測データの偏差積の総和が、偏差積和です。

共分散は、偏差積和をデータ数nで割ったものです。共分散は、偏差積の平均値ということになります。

上記したA君、B君、C君の身長・体重でいうと、

  • A君の身長と3人の身長の平均の差が、偏差
  • A君身長の偏差と体重の偏差を掛けたものが、(A君の)偏差積
  • A君、B君、C君の偏差積を足し合わせたもの、偏差積和
  • その偏差積和を3で割れば、共分散

となります。

統計学で、これらを使うのは、相関係数を計算するときですね。相関係数の計算方法で書いていますので、よろしければどうぞ。