統計学の区間推定と仮説検定は類似した点を持っています。
母集団から標本を抜きとり、求めた統計量を利用する点は、双方に共通しています。推定では、標本平均、標本標準偏差を用います。検定でも、標本平均、標本標準偏差を用います。
区間推定と仮説検定
区間推定
母平均の区間推定では、未知である母平均がどのくらいの範囲に収まるかを推定しようとします。標本平均からどのくらいの範囲に、何%確率で存在しているのかを推定します。
この%のことを信頼係数というのですが、95%を設定することが多いです。
参考記事 点推定と区間推定の意味と違い
仮説検定
仮説検定は、母平均がある特定の値であるという仮定したときに、実際に観測できた標本の平均が偶然にその数値になる確率を求めます。
その確率がある基準よりも小さければ、母平均がある特定の値であるという仮定は正しくないと判定する行為です。その基準値とは5%となることが多いです。
参考記事 検定とは何をするのか。意味、やり方、有意差、棄却、帰無仮説などを説明
パンの重量で区間推定と仮説検定を考えてみると
パンの重量で考えてみましょう。パン10個を測定してみると、標本平均は100g、標本の標準偏差は5gでした。母集団の標準偏差はわからず、未知です。
区間推定
母集団の標準偏差が未知のときの区間推定では、母平均は、標本平均100gから、
± 標準誤差\((\frac{s}{\sqrt{n}})\) 2.226個分
の区間に95%の確率で収まるだろう、と推し量ります。標本の標準偏差は5、n=10 ですから、
$$100g±2.226\times\frac{5}{\sqrt{10}}$$
の区間に95%の確率でこのパンの母平均が存在するだろうという予測です。
仮説検定
仮説検定では次のようになります。パンの母平均が100gであると仮定があり、パン10個を測定してみて、標本平均は95g、標本の標準偏差は5gであったとしましょう。
スチューデントのt統計量は、
$$\frac{95-100}{5/\sqrt{10}}$$
で、自由度9 のt分布に従います。
t統計量が、2.226 より大きくなる、または -2.226より小さくなる確率は5%です。もしそうなったのであれば、5%のような小さい確率のことはめったに起きないのだから、仮説は正しくない、と判定を下します。
このパンの場合では、t統計量は、1.581 となりました。よって、仮説は間違えているとは言えません。
これは、母平均として仮定した100gから見て、95%の確率で収まる範囲である
$$100g±2.226\times\frac{5}{\sqrt{10}}$$
に、標本平均が収まったということになります。もし仮に標本平均がこの範囲から外に出ていたら、母平均は100gであるという仮説は、正しくないと言うわけです。
区間推定と仮説検定の違い
くだけた言い方をすると、
- 母平均の推定は、母平均が未知であり、どの範囲にあるかを知るもの
- 母平均の検定は、母平均がわかっていて本当に正しいかを判定するもの
です。
同じように標本平均や標準誤差を用いますが、考え方の方向性が違うことがわかります。