箱ヒゲ図の見方

箱ヒゲ図とは、データのばらつきをわかりやすく表現した図で、大きいほうから小さいほうに並べたデータを、中央付近を箱の図で表し、そこから外にあるデータを細いヒゲのような線で表します。

箱ヒゲ図

こんな感じの図です。縦軸がデータの値です。

中央部分は、箱で表すと書きましたが、第1四分位数から第3四分位数までを箱として表します。ヒゲは最小値、最大値まで伸ばします。

箱ヒゲ図を作るには、最小値、第1四分位点、第2四分位点、第3四分位点、最大値を算出する必要があるのですね。図の中に、「最小値、第1四分位点、第2四分位点、第3四分位点、最大値はここですよ」と示すとこうなります。

箱の範囲は第1四分位点~第3四分位点の範囲ですから、四分位範囲というばらつき具合を示す指標のひとつでもあります。

平均値は読みとれない

平均値を箱の中に「×」の印で示すこともありますが、それがない場合は、箱ヒゲ図からは平均値を読みとることはできません。

箱ヒゲ図の比較

ここに同じ工場内にて、2つの機械で製造した同じ製品の長さを計測したデータがあります。同じ製品といえども、製造機械が異なると製品のばらつきも変わってくることがあります。2つの機械でつくった製品の長さにどんなばらつきがあるのか、箱ヒゲ図で見てみましょう。

機械1 のデータ105,101,107,105,110,105,101,103,117,116,110,100,109,112,114,111,107,109,112,114,115,115,99
機械2 のデータ
107,104,110,111,110,118,116,104,116,107,118,112,112,116,113,108,115,118,116,114,116,104,112

それぞれのデータを、箱ヒゲ図で表すとこうなります。今度は横向きにしてみました。

この箱の部分に半分のデータが入っているのだな、半分のデータが集中しているのだな、と読みとることができますし、その位置によって分布の歪みがあるかどうかわかります。機械2は、分布が歪んでいるでしょう。

また、複数のデータセットの箱ヒゲ図を並べることで比較が可能です。機械1 、機械2 では、第1四分位点~第3四分位点の範囲がこれだけ異なっているのだな、と読みとることができます。

フォローする