平均値や分散・標準偏差の性質。単位を変えると値が変わる

データから計算される平均や標準偏差は、データから計算されるもの。データを何倍かにしたり、定数を加えたりすると、平均や標準偏差も影響を受けて変化します。

平均、標準偏差、分散で影響の受け方が違います。

この記事では、データの変化に伴って、平均や標準偏差がどのように変化するのか、

たとえば、各データをa倍すると、標準偏差もa倍になります。

データを変化させて、平均、標準偏差、分散の変化を見てみる

平均、分散、標準偏差には下記のような性質があります。

  • データに定数aを加えると平均はaを加えた値となり、標準偏差と分散は変化しない
  • データをa倍すると、平均はa倍、標準偏差はa倍、分散はaの二乗倍になる
  • データをa倍し、定数bを加えると、平均はa倍、標準偏差はa倍しただけ、分散はaの二乗倍しただけのものになる

これらの性質を、ある5人の高校生の身長を例にとって考えていきます。

身長を計測すると、

1.62m、1.64m、1.68m、1.71m、1.74m

のデータが得られました。

データに定数aを加えると平均はaを加えた値となり、標準偏差と分散は変化しない

1.62m、1.64m、1.68m、1.71m、1.74m

これらの身長データの平均と標準偏差は次のとおりです。

  • 平均は1.68
  • 標準偏差は0.0440
  • 分散は、0.001936

です。

ここに、定数aを加えるとどうなるか。ここではa=0.1cmを加えてみます。

1.72m、1.74m、1.78m、1.81m、1.84m

のデータとなります。

  • 平均は、1.78
  • 標準偏差は、0.0440
  • 分散は、0.001936

となりました。

もとのデータに定数aを加えると、平均は定数aを加えた値となり、標準偏差は変わらず、分散も変わらないままでした。

データをa倍すると、平均はa倍、標準偏差はa倍、分散はaの二乗倍になる

上記の身長データの単位はm表記でしたが、単位をcmに変換してみます。1m=100cmですから、データの数値は100倍になります。

1.62m、1.64m、1.68m、1.71m、1.74m

これらもとのデータをcm表記に変換すると、数字としては100倍になります。

162cm、164cm、168cm、171cm、174cm

です。これらのデータから平均値、標準偏差、分散を計算すると、

  • 平均は、168
  • 標準偏差は、4.40
  • 分散は、19.36

となりました。

測定単位がmからcmに変わり、数字が100倍となったことで、

  • 平均は、1.68 → 168(100倍)
  • 標準偏差は、0.044 → 4.44(100倍)
  • 分散は、0.001936 → 19.36(10000倍)

となりました。

データをa倍すると、平均はa倍、標準偏差はa倍、分散はa2 倍となりました。

データをa倍し、定数bを加えると、平均はa倍、標準偏差はa倍しただけ、分散はaの二乗倍しただけのものになる

1.62m、1.64m、1.68m、1.71m、1.74m

これらのデータをcm単位からmm単位に変換して100倍し、定数10を加えると、

172cm、174cm、178cm、181cm、184cm

のデータとなります。これらデータの平均、標準偏差、分散を計算すると、

  • 平均は、1.68 → 178(10倍+10)
  • 標準偏差は、0.044 → 4.40(100倍)
  • 分散は、0.001936 → 19.36(10000倍)

となりました。

データをa倍して定数bを加えると、平均はa倍+b、標準偏差はa倍、分散はa2 倍となりました。

測定単位が変わると、標準偏差も変わる

平均も、ばらつき度合いを表す標準偏差も、測定単位の変化によって変わることがわかりました。

mからcmに変換したことで、標準偏差は100倍になりましたが、高校生5人の身長のばらつきが大きくなったわけではもちろんありません。

バラつき度合を示す標準偏差の数値が大きくなっただけです。

数字だけみれば、「cmのデータのほうがばらつきが大きい」と誤った認識してしまいそうですが、単に測定単位が変わっただけです。

このようなときには変動係数を用いるとよいです。測定単位に関わらず、同じ数値になる指標として、変動係数があります。

参考:変動係数の意味と求め方

フォローする