統計学でいうヒンジとは

データを大きさの順に並べて、

「中央値よりも小さいほうの範囲」の中央値を下側ヒンジ

「中央値よりも大きいほうの範囲」を上側ヒンジ

といいます。

ヒンジの計算方法

データ数が5個の場合

次のような5個のデータがあったとします。

12、13、14、15、17

赤色にした数値が中央値ですよね。大きさ順で並べて、ちょうど真ん中にくる数値が中央値です。

参考:代表値とは?平均値、中央値、最頻値の特徴を紹介

下側ヒンジは、全体のデータの中央値もつかってヒンジを求めます。

12、13、14、15、17

下側のデータのなかでの中央値は、13となります。これが下側ヒンジです。

上側の範囲も、全体のデータの中央値もつかってヒンジを求めます。

12、13、14、15、17

上側のデータのなかでの中央値は、15となります。これが上側ヒンジとなります。

データ数が8個の場合

次のような8個のデータがあったとします。

12、12、13、14、15、15、16、17

中央値は、大きさ順で並べて、5番目と6番目にくる数値の平均です。

(14+15)/ 2 = 14.5

14.5が中央値となります。

中央値よりも下側のデータをすべてつかいます。

12、12、13、14、15、15、16、17

この中で、12+13 / 2 = 12.5

下側の範囲のなかでは、12.5 が中央値になります。これが下側ヒンジです。データ個数が偶数の場合は、全データの中央値にデータ点が含まれないので、下側4つのデータを使って計算しています。

上側の範囲、上側ヒンジについても同様です。

12、12、13、14、15、15、16、17

(15+16)/ 2 = 15.5

上側の範囲のなかでは、15.5 が中央値になります。これが上側ヒンジとなります。

フォローする