歪度の意味・解釈と求め方

シェアする

分布の形状を見るときに利用されるものとして、歪度があります。

歪度とはなにか

「歪度」とは、分布が左右対称であるか、あるいは文字通り、分布の歪み度合いを示すものです。

歪度 = E(X-μ)3 / σ3

= 1/n × Σ((Xi-μ) / σ )3

これを歪度(または歪度係数)といって、歪度が0 よりも大きければ右の裾が長い分布、歪度が0 よりも小さければ左の裾が長い分布となります。

通常Z値を計算(平均が0、標準偏差が1 の標準化)をするときには、

(X-μ) / σ

で計算しますよね。これを3乗した値の平均が、歪度の値となります。

歪度 > 0 (歪度係数が0より大きい)・・・右の裾が長い分布

歪度 = 0・・・左右対称。正規分布のときには0になります。

歪度 < 0 (歪度係数が0より小さい)・・・左の裾が長い分布

ただ、歪度 = 0であったとしても、分布が必ずしも左右対称であるということではなく、標準化したZ値の平均値(=0)の右側にあるZ3の和と、左側にあるZ3の和が一致しているということです。

歪度の絶対値が小さければ、標準化したZ値の平均値(=0)の右側にあるZ3の和と、左側にあるZ3の和の差が、小さいことになります。

なぜ3乗で計算し、歪度が0を越えると右の裾が長い分布を示すことになるのか

歪度は、なぜこのように3乗して計算し、0を越えると右の裾が長い分布、0より小さいと左の裾が長い分布を示すことなるのでしょうか。

まず、歪度がプラスの値なのかマイナスの値なのかは、もともとのZ値によります。(X-μ) / σ の値がプラスの値であれば、3乗をしてもプラスの値です。しかし(X-μ) / σ の値がマイナスであれば、2乗であれば、マイナスが消えてプラスの値となりますが、3乗をすると、またマイナスの値となります。

右の裾が長い分布だと、Z値「(X-μ) / σ 」の平均から遠く離れたデータが右の裾の先にあります。それらの値を3乗すると大きな値となりますから、結果として歪度の値もプラス方面に大きくなりやすいのです。逆に左の裾が長い分だと、左の裾の先に平均から離れたマイナスのデータがありますから、結果として歪度の値がマイナス方面に数値が出ます。

データの値が平均値から絶対値1を越えて、平均値から離れるほど、3乗した値は大きくなります。

ですから、右の裾が長い分布であるほど、歪度も大きな値となるのです。

引き続き、右裾の長い分布の図を見ながら考えてみましょう。

長く伸びた右裾の部分にあるデータは、((X-μ) / σ )3の値は3乗される効果によって大きくなりますよね。逆に左裾は長くないのですから、((X-μ) / σ )3の値も、あまり大きくならないでしょう。

それらの値を平均すると、右裾が長ければ長いほど、大きなプラスの値になるはずです。

■左右対称かどうか

  • 歪度>0(歪度が0より大きい)・・・右の裾が長い分布
  • 歪度=0・・・左右対称の分布、中心から左のZ3の和、右のZ3の和が一致
  • 歪度<0(歪度が0より小さい)・・・左の裾が長い分布

■非対称性の程度

  • 歪度の絶対値の大きさで、非対称性の程度を示すことができる
  • 片側の裾が長く伸びた分布など、片側だけに平均から離れているデータが多いと、歪度の絶対値は大きくなる

どんなグラフが、どんな歪度係数になるか

次のグラフは、右裾が長い分布です。この歪度を、エクセル関数SKEWで調べると、0.795でした。

■歪度=0.783

次は、正規分布に近い分布です。この歪度を、エクセル関数SKEWで調べると、0.035でした。

■歪度=0.035

正規分布のように左右対称であれば、歪度=0 となり、このグラフのように左右対称に近ければ、歪度も0 付近になります。とはいえ、歪度が0 または0 に近いことは、分布が必ずしも左右対称であるということではなく、標準化したZ値の平均値(=0)の右側にあるZ3の和と、左側にあるZ3の和が一致しているということです。

たとえば、ひとつ上に掲載した右裾の長い分布は、歪度 0.795 でした。ここに75g、76gのデータを少し加えてみると、歪度係数は 0.075 となり、0 に近くなってしまいました。

■歪度 = 0.074

左右対称という感じではありません。

次は、ひとつ上の分布に、77gのデータをいくつか加えてみた分です。歪度係数はマイナスに傾きました。

■歪度= -0.595

片側の裾が伸びているわけではなく、外れ値の影響であっても、歪度係数は変わってしまいます。