箱ヒゲ図の見方




箱ヒゲ図とは、データのばらつきをわかりやすく表現した図で、大きいほうから小さいほうに並べたデータを、中央付近を箱の図で表し、そこから外にあるデータを細いヒゲのような線で表したものです。

箱ヒゲ図の見方

こんな感じの図です。縦軸がデータの値です。

箱で表す中央部分は、第1四分位数から第3四分位数までです。

ヒゲは最小値、最大値まで伸ばします。

箱ヒゲ図を作るには、最小値、第1四分位点、第2四分位点、第3四分位点、最大値を算出する必要があるのですね。図の中に、「最小値、第1四分位点、第2四分位点、第3四分位点、最大値はここですよ」と示すとこうなります。

箱の範囲は第1四分位点~第3四分位点の範囲ですから、四分位範囲というばらつき具合を示す指標と同じ範囲を示しています。

平均値は読みとれない

平均値を箱の中にバツ印(×)などで示すこともありますが、それがない場合は、箱ヒゲ図からは平均値を読みとることはできません。

箱ヒゲ図の比較

ここに同じ工場内にて、2つの機械で製造した同じ製品の長さを計測したデータがあります。

同じ製品といえども、製造機械が異なると製品のばらつきも変わってくることがあります。2つの機械でつくった製品の長さにどんなばらつきがあるのか、箱ヒゲ図で見てみましょう。

機械1 のデータ105,101,107,105,110,105,101,103,117,116,110,100,109,112,114,111,107,109,112,114,115,115,99
機械2 のデータ
107,104,110,111,110,118,116,104,116,107,118,112,112,116,113,108,115,118,116,114,116,104,112

それぞれのデータを、箱ヒゲ図で表すとこうなります。今度は横向きにしてみました。

箱ヒゲ図を見て、「この箱の部分に半分のデータが入っているのだな、半分のデータが集中しているのだな」と読みとることができます。

複数のデータセットの箱ヒゲ図を並べることで比較が可能です。機械1 、機械2 では、第1四分位点~第3四分位点の範囲がこれだけ異なっているのだな、と読みとることができます。

箱ひげ図の外れ値

外れ値とは、他のデータからみて、極端に大きな値、または極端に小さな値のことです。

箱ひげ図上で外れ値を考慮する場合は、ひげの長さを箱(第1四分位数から第3四分位数まで)の1.5倍に設定します。極端に大きな値または極端に小さな値は、丸印(〇)やバツ印(×)で示します。