変動係数の意味と求め方

変動係数とは、標準偏差を平均値で割った値のことです。変動係数によって異なる平均値を持つ集団を比較することができるという点で、役に立つ指標です。

身長を測る単位がm とcm では標準偏差が異なる

ある高校生5人の身長を計測してみましょう。その結果、

1.62m、1.64m、1.68m、1.71m、1.74m

というデータが得られました。

  • 平均は1.68
  • 標準偏差は0.044

です。ここでは測定単位をmとしていますが、データ単位をcmに変換してみると、

162cm、164cm、168cm、171cm、174cm

となりますよね。平平均値と標準偏差をみると、

  • 平均は168
  • 標準偏差は4.4

となります。

平均は1.68mから168cm、標準偏差は0.044から4.44と大きくなりました。

mからcmに変換したことで、高校生5人の身長やばらつきが大きくなったわけではなくて、もちろんありません。バラつき度合を示す標準偏差の数値が大きくなっただけです。単に単価が変っただけで、実際には身長は同じままです。

数字だけ見ると、cmのデータのほうがバラつきが大きいように思ってしまいますね。誤った認識をしてしまいそうです。

測定単位に依存しない変動係数

数字自体は確かに大きくなっていますが、実際の身長のバラつきが変わったわけではありません。そうであるならば、測定単位を変換しても変わらることのないばらつきの指標がほしいものです。

こんなときに、役立つ指標として、変動係数があります。

変動係数とは、標準偏差を平均値で割った値で、測定単位が変換されても、変動係数はまったく影響を受けません。

hendoukeisuu

※CV=confficient of variation

m単位の場合は、標準偏差0.044、平均身長が1.68ですから、

0.044÷1.68=0.02619

変動係数は、0.026となりました。

cm単位の場合は、標準偏差が4.4、平均身長が168ですから、

4.4÷168=0.02619

変動係数は、0.026となりました。

変動係数は、m単位のときでも、cm単位のときでも0.026 となります。両者ともに同じ数値となりました。これは、平均値1単位あたりのばらつきの測度として考えることができます。ばらつき0.44は、1.68あたりで0.026の数値であり、ばらつき4.4は、168あたりで0.026ということです。

異なる平均値を持つ集団のばらつきを比較する

異なる平均値をもつ2組以上の集団のデータについて、ばらつき度合を比較するときに変動係数が活用できます。同じくらいの平均値をもつ集団であれば標準偏差で比較ができますが、平均値が大きく異なる場合は単純に標準偏差では比較することができません。そのような場合には、変動係数を活用します。

たとえば、

  • 日本人の平均体重と標準偏差
  • 中国人の平均体重と標準偏差

この2つを比較するときには、そのままの値で比較しても問題ないでしょう。 わずかな違いはあれど、日本人の体重と中国人の体重の平均と標準偏差はほとんど近しい値であり、そのままの数値で比較できそうです。

しかし、

  • ヒトの平均体重と標準偏差
  • ゾウの平均体重と標準偏差

を比較する場合はどうでしょうか。大人のヒトの平均体重が70Kg、大人のゾウの平均体重が5000kgであるとしたら、ヒトの体重の標準偏差よりも、ゾウの体重の標準偏差のほうが圧倒的に大きな数値のはずです。

ヒトとゾウの体重の標準偏差をそのままの数字で比較すれば、絶対値としてはゾウの体重のほうがばらつきが大きいといえます。当たり前にこうなってしまいますが、ばらつきを比較するなら、何倍も大きいゾウの平均体重を差し引いて考えるのが公平ですよね。

それぞれの体重の標準偏差をそのまま比較するのではなく、標準偏差を平均体重で割った変動係数で比較することで、体重の大きさに対する相対的なばらつきを見ることができます。変動係数は、ばらつきの基準化なのです。

こうすることで平均体重の値に対してどのくらいのばらつきがあるのかを示すことができ、晴れてヒトとゾウの体重の標準偏差を対等に扱って比較することが可能になります。