グラフで見る平均値-中央値-最頻値の位置

データ全体を代表する値や、データの分布の中心的に位置する値を代表値といい、代表値には平均値、中央値、最頻値があります。分布をグラフにして見てみたときに、どのようなグラフなのかによって、平均値、中央値、最頻値の位置が変わってきます。

正規分布であれば、平均値はグラフ中央になりますが、偏りのあるグラフだと平均値はグラフ中央からズレます。

分布グラフの形によって平均値、中央値、最頻値の位置がどのように変わってくるでしょうか。

正規分布

まず正規分布のグラフの場合です。たとえば、人の身長の分布はこのようなグラフとなるでしょう。横軸が身長の階級(165cmとか170cmとか)、縦軸がその身長である人の人数です(度数)。グラフの真ん中の部分が、平均値であり、順番で見てもちょうど中央にあります。また、データの数量も一番多いです。

平均値、中央値、最頻値が一致します。

heikin-tyuuou-saihinti-seikibunpu

偏りのある分布

右側の裾が伸びたグラフの場合です。たとえば、日本の世帯の平均貯蓄額などは、このような右裾が長く伸びたグラフになります。下限は0円と決まっていますが、上限は無く、数は少なくなりますが非常に多くの貯蓄額をもった世帯が存在しているからです。

縦軸が世帯数、横軸が貯蓄額とします。この場合は、まず最頻値は一番データの多い数です。中央値は、貯蓄額を順番に並べて、真ん中に来た世帯の貯蓄額です。右裾が伸びている分、最頻値より右寄りになります。

平均値は、右裾のたくさんの貯蓄がある世帯に影響を受けますから、中央値よりさらに右側になります。

heikin-tyuuou-saihinti-katayori
右裾が長く長く伸びていればいるほど、平均値もグラフの右側に寄っていきます。平均値を見るときには、分布グラフのどのようにな形になっているかも注意する必要があります。