変動係数とは、標準偏差を平均値で割った値のことです。
変動係数は、異なる平均値を持つ集団を比較することができるなど役に立つ指標です。
変動係数の求め方
変動係数とは、標準偏差を平均値で割った値です。
変動係数CVの計算式は、次のとおりです。
$$CV=\frac{\sigma}{\bar{x}}$$
※CV=confficient of variation=変動係数
変動係数と標準偏差の違い
身長単位のm とcm など測定単位によって標準偏差は変わってしまう
ある高校生5人の身長を計測してみましょう。その結果、
1.62m、1.64m、1.68m、1.71m、1.74m
というデータが得られました。
- 平均は1.678m
- 標準偏差は0.044
です。ここでは測定単位をmとしていますが、データ単位をcmに変換してみると、
162cm、164cm、168cm、171cm、174cm
となりますよね。平均値と標準偏差をみると、
- 平均は167.8cm
- 標準偏差は4.4
となります。
測定単位をmからcmへ帰ることで、平均は1.678mから167.8cmへ、標準偏差は0.044 から4.4 へと大きくなりました。
mからcmに変換したことで、高校生5人の身長やばらつきが大きくなったわけではなくて、もちろんありません。バラつき度合を示す標準偏差の数値が大きくなっただけです。単に測定単位が変っただけで、実際には身長は同じままです。
数字だけ見ると、cmのデータのほうがバラつきが大きいように思ってしまいますね。誤った認識をしてしまいそうです。
変動係数は測定単位に依存しない
数字自体は確かに大きくなっていますが、実際の身長のバラつきが変わったわけではありません。そうであるならば、測定単位を変換しても変わらることのないばらつきの指標がほしいものです。
こんなときに役立つ指標が、変動係数です。
測定単位が変換されても、変動係数はまったく影響を受けません。
$$CV=\frac{\sigma}{\bar{x}}$$
で変動係数を求めてみましょう。
m単位の場合
m単位の場合は、標準偏差0.044、平均身長が1.678ですから、
$$\frac{0.044}{1.678}=0.02622$$
変動係数は、約0.026となりました。
cm単位の場合
cm単位の場合は、標準偏差が4.4、平均身長が1678ですから、
$$\frac{4.4}{167.8}=0.02622$$
変動係数は、約0.026となりました。
m単位でもcm単位でも変動係数は変わらない
変動係数は、m単位のときでも、cm単位のときでも、0.026 となりました。
両者ともに同じ数値となりましたね。
変動係数は、平均値1単位あたりのばらつきの測度として考えることができます。
m単位の場合の、ばらつき0.44 は、1.678 あたりで0.026 の数値。
cm単位の場合の、ばらつき4.4 は、167.8 あたりで0.026 の数値ということです。
変動係数を使う意味
単位が無くなる
上記したように変動係数は単位に影響を受けませんし、単位がありません。
標準偏差を平均値で割ることによって、平均値1あたりの数値を見ることができます。
これにより、平均値に差がある2組を比較できるようになります。
異なる平均値を持つ集団のばらつきを比較することができる
異なる平均値をもつ2組以上の集団のデータについて、ばらつき度合を比較するときに変動係数が活用できます。
同じくらいの平均値をもつ集団であれば標準偏差で比較ができますが、平均値が大きく異なる場合は単純に標準偏差では比較することができません。そのような場合には、変動係数を活用します。
たとえば、
- 日本人の平均体重と標準偏差
- 中国人の平均体重と標準偏差
この2つを比較するときには、そのままの値で比較しても問題ないでしょう。 わずかな違いはあれど、日本人の体重と中国人の体重の平均と標準偏差はほとんど近しい値であり、そのままの数値で比較できそうです。
しかし、
- ヒトの平均体重と標準偏差
- ゾウの平均体重と標準偏差
を比較する場合はどうでしょうか。大人のヒトの平均体重が70Kg、大人のゾウの平均体重が5000kgであるとしたら、ヒトの体重の標準偏差よりも、ゾウの体重の標準偏差のほうが圧倒的に大きな数値のはずです。
ヒトとゾウの体重の標準偏差をそのままの数字で比較すれば、絶対値としてはゾウの体重のほうがばらつきが大きいといえます。
当たり前にこうなってしまいますが、ばらつきを比較するなら、何倍も大きいゾウの平均体重を差し引いて考えるのが公平ですよね。
それぞれの体重の標準偏差をそのまま比較するのではなく、標準偏差を平均体重で割った変動係数で比較することで、体重の大きさに対する相対的なばらつきを見ることができます。変動係数は、ばらつきの基準化なのです。
こうすることで平均体重の値に対してどのくらいのばらつきがあるのかを示すことができ、晴れてヒトとゾウの体重の標準偏差を対等に扱って、比較することが可能になります。