データから計算される平均や標準偏差は、データを何倍かにしたり、定数を加えたりすると、平均や標準偏差も影響を受けて変化します。
ただし、平均、標準偏差、分散はそれぞれ影響の受け方が違います。
この記事では、データの変化に伴って、平均や標準偏差、分散がどのように変化するのか解説をします。
データを変化させて、平均、標準偏差、分散の変化を見てみる
平均、分散、標準偏差には下記のような性質があります。
- データに定数aを加えると平均はaを加えた値となり、標準偏差と分散は変化しない
- データをa倍すると、平均はa倍、標準偏差はa倍、分散はaの二乗倍になる
- データをa倍し、定数bを加えると、平均はa倍してbを加えた値、標準偏差はa倍しただけ、分散はaの二乗倍しただけのものになる
これらの性質を、ある5人の高校生の身長を例にとって考えていきます。
身長を計測すると、
1.62m、1.64m、1.68m、1.71m、1.74m
のデータが得られました。
データに定数aを加えると平均はaを加えた値となり、標準偏差と分散は変化しない
1.62m、1.64m、1.68m、1.71m、1.74m
これらの身長データの平均と標準偏差は次のとおりです。
- 平均は1.68
- 標準偏差は0.0440
- 分散は、0.001936
です。
ここに、定数aを加えるとどうなるか。ここではa=0.1mを加えてみます。
1.72m、1.74m、1.78m、1.81m、1.84m
のデータとなります。
- 平均は、1.78
- 標準偏差は、0.0440
- 分散は、0.001936
となりました。
データをa倍すると、平均はa倍、標準偏差はa倍、分散はaの二乗倍になる
上記の身長データの単位はm表記でしたが、単位をcmに変換してみます。1m=100cmですから、データの数値は100倍になります。
1.62m、1.64m、1.68m、1.71m、1.74m
これらもとのデータをcm表記に変換すると、数字としては100倍になります。
162cm、164cm、168cm、171cm、174cm
です。これらのデータから平均値、標準偏差、分散を計算すると、
- 平均は、168
- 標準偏差は、4.40
- 分散は、19.36
となりました。
測定単位がmからcmに変わり、数字が100倍となったことで、
- 平均は、1.68 → 168(100倍)
- 標準偏差は、0.044 → 4.44(100倍)
- 分散は、0.001936 → 19.36(10000倍)
となりました。
データをa倍し、定数bを加えると、平均はa倍してbを加えた値、標準偏差はa倍しただけ、分散はaの二乗倍しただけのものになる
1.62m、1.64m、1.68m、1.71m、1.74m
これらのデータをcm単位からmm単位に変換して100倍し、定数10を加えると、
172cm、174cm、178cm、181cm、184cm
のデータとなります。これらデータの平均、標準偏差、分散を計算すると、
- 平均は、1.68 → 178(10倍+10)
- 標準偏差は、0.044 → 4.40(100倍)
- 分散は、0.001936 → 19.36(10000倍)
となりました。
測定単位が変わると、標準偏差も変わる
平均も、ばらつき度合いを表す標準偏差も、測定単位の変化によって変わることがわかりました。
単位をmからcmに変換したことで、標準偏差は100倍になりましたが、高校生5人の身長の差が100倍に広がったわけではないですよね。
標準偏差の数値自体はたしかに大きくなったので、数字だけみれば「cmのデータのほうがばらつきが大きい」と認識してしまいそうですが、単に測定単位が変わっただけです。
平均値に対してのばらつきの数値は大きくなったわけではありません。
変動係数を見るとそれがわかります。
変動係数とは、標準偏差を平均値で割った値のことで、平均値あたりの標準偏差を見るものです。
上記した身長の数値を例とすると、単位をmからcmに変えたことにより標準偏差の数値が大きくなったとしても、変動係数の数値は同じままです。
測定単位に関わらず、同じ数値になる指標として活用することができます。
参考記事 変動係数の意味と求め方