分散・標準偏差を区間推定するには

シェアする

あるメーカーで製品をつくった時に、どのくらいの重量なのだろうと、 秤にのせてはかってみたところ次のようなデータが得られたとします。

97g、98g、100g、102g、103g

製品は毎日毎日つくられており、これからもつくられていくものですので、無限母集団と考えます。そこから取り出した標本がこの5つです。母集団の分散は、次の式で推定することができました。

☆母集団の分散の不偏推定値

fuhenbunsan2

点の推定はできても、この式では区間推定をすることができません。 χ2分布と呼ばれる分布を活用すれば、分散あるいは標準偏差の区間推定をすることができます。

偏差平方和をσ2で割った値がχ2値です。このχ2値がどういった分布をするのかを見ることで区間を推定することができます。

kainijyousiki6

kainijyousiki1

偏差平方和を大文字の「S」で表すと、

kainijyousiki5

という式にできます。偏差平方和は、各データの偏差を二乗した値を足し合わせたものですから、データの数が増えるほど、偏差平方和は大きくなります。同時にχ2値も大きくなるわけですから、各データ数毎に分布が存在しています。

ばらつきの区間を計算する

上記した5つのデータの偏差平方和は、

((97-100)2 +(98-100)2 +(100-100)2 +(102-100)2 +(103-100)2)  = 25

偏差平方和は25です。

χ2 = S/σ2
= 25/σ2

自由度φは、
φ = n-1
= 5-1
= 4

となります。
自由度φ=4のχ2分布グラフを見てみましょう。

kainijyougurafu3-jiyuudo4

黒く塗りつぶした箇所が下側5%と上側5%の区間です。この間が90%の信頼区間になります。χ2値はそれぞれ、

下側 0.711

上側 9.49

です。この値は、χ2分布表で確認することができます。 χ2分布表とは、「自由度φ=1の場合には、○○%の確率でS/σ2の値が○○になる」といった数値が、各自由度ごとに記載されている表です。

χ2値は90%の確率で0.711~9.49の間におさまることになりますので、

0.711 < χ2 < 9.49

と式をつくることができ、χ2 = S/σ2 ですから、

0.711 < S/σ2 < 9.49

になります。この範囲が90%信頼区間です。上で計算した偏差平方和を代入すると、

0.711 < 25/σ2 < 9.49

となります。これを計算していきましょう

分子と分母をひっくり返すと、不等号の向きが逆となり、
1/0.711 > σ2/25 > 1/9.49

25を掛け算すると、
25/0.711 > σ2 > 25/9.49
35.16 > σ2 > 2.63

このままでは分散ですから、標準偏差にするため平方根をとると、
5.93 > σ> 1.62

母標準偏差σの90%信頼区間は、1.62~5.93となりました。