データを大きさの順に並べて、
「中央値よりも小さいほうの範囲」の中央値を下側ヒンジ
「中央値よりも大きいほうの範囲」の中央値をを上側ヒンジ
といいます。
ヒンジの計算方法
データ数が5個で奇数の場合、データ数が8個で偶数の場合についてヒンジを計算してみましょう。
データ数が5個で奇数の場合
次のような5個のデータがあったとします。
赤色にした数値が中央値ですよね。大きさ順で並べて、ちょうど真ん中にくる数値が中央値です。
下側ヒンジは、全体のデータの中央値もつかってヒンジを求めます。
下側のデータのなかでの中央値は、13となります。これが下側ヒンジです。
上側の範囲も、全体のデータの中央値もつかってヒンジを求めます。
上側のデータのなかでの中央値は、15となります。これが上側ヒンジとなります。
データ数が8個で偶数の場合
次のような8個のデータがあったとします。
中央値は、大きさ順で並べて、5番目と6番目にくる数値の平均です。
(14+15)/ 2 = 14.5
14.5が中央値となります。
中央値よりも下側のデータをすべてつかいます。
この中で、12+13 / 2 = 12.5
下側の範囲のなかでは、12.5 が中央値になります。これが下側ヒンジです。データ個数が偶数の場合は、全データの中央値にデータ点が含まれないので、下側4つのデータを使って計算しています。
上側の範囲、上側ヒンジについても同様です。
(15+16)/ 2 = 15.5
上側の範囲のなかでは、15.5 が中央値になります。これが上側ヒンジとなります。