グラフで見る平均値-中央値-最頻値

シェアする

データの分布の中心的に位置する値、データ全体を代表する値を代表値といい、代表値には平均値、中央値、最頻値があります。偏りのあるグラフだと、平均値は分布中央からずれてしまいます。これを正規分布と偏りのある分布のグラフで確認しましょう。

正規分布

まず正規分布のグラフです。例えば、人の身長の分布として考えると、横軸が身長の階級(○○cm)、縦軸がその身長である人の人数です(度数)。グラフの真ん中の部分が、平均値であり、順番で見てもちょうど中央にあります。また、データの数量も一番多いです。

平均値、中央値、最頻値が一致します。

heikin-tyuuou-saihinti-seikibunpu

偏りのある分布

右側の裾が伸びたグラフです。たとえば、日本の世帯の平均貯蓄額などは、このような右裾が長く伸びたグラフになります。下限は0円と決まっていますが、上限は無く、数は少なくなりますが非常に多くの貯蓄額をもった世帯が存在しているからです。

縦軸が世帯数、横軸が貯蓄額とします。この場合は、まず最頻値は一番データの多い数です。中央値は、貯蓄額を順番に並べて、真ん中に来た世帯の貯蓄額です。右裾が伸びている分、最頻値より右寄りになります。平均値は、右裾のたくさんの貯蓄がある世帯に影響を受けますから、中央値よりさらに右側になります。

heikin-tyuuou-saihinti-katayori
右裾が長く長く伸びていればいるほど、平均値もグラフの右側に寄っていきます。平均値を見るときには、分布グラフのどのようにな形になっているかも注意する必要があります。