推定量の不偏性と一致性

標本から得た統計量をもとに、母集団のパラメータを推定するとき、標本の統計量のことを、推定量といいます。

標本平均は、母平均の推定量となるのですが、それは、母数のパラメータθ に近しいものであることを望みますよね。

その重要な基準としてあるのが、不偏性と一致性です。

不偏性とは

不偏性とは、推定量の期待値が、真の母数の値となることです。これを満たす推定量を不偏推定量といいます。

「不」、「偏り」、ですから、平均的に過大、過小の評価がなくて、偏りがないというこです。

偏りとは、平均値でいうと、観測値から得た標本平均と、母集団の真の平均の間にある偶然ではないズレのことです。

ゴルフのカップ(ボールを入れる穴)に向けて10回ショットを打つときのことを考えてみましょう。

この場合、ショットの強さがあっておらず、10回すべてカップの奥にボールが落ちました。ショットの強さにはばらつきがなくて、すべてカップ奥の5m付近のところにボールが落ちました。平均的に奥のほうにズレてしまっているということですね。

これが偏りです。

もし、標本から得た推定値がこのような状態になっていると、それは推定値が真の値の回りに散布しておらず、望ましい推定量とは言えません。いくら標本サイズを大きくしても(データの数を増やしても)、推定値の平均は、真の値と一致しないでしょう。

平均しても、真の値には近くならないのです。

一致性とは

一致性とは標本サイズnが大きくなるに従って、推定量が、母集団の真の値に近づいていくことです。表現を変えると、

n→∞の場合

(推定量-真の値 > ε )の確率が、0 に近づいていく

ことです。これを満たす推定量を不偏推定量といいます。

先ほどと同じようにゴルフのショットであらわすのであれば、こうです。ショット後のボールの落下位置は、カップの少し手前に落ちたり、裏側に落ちたりして、カップを中心にばらついている状態でした。

1ショットはカップ手前に、2ショットも手前に、3ショット目はカップの奥に落ちました。これでは、平均的にカップのところとはなりませんが、さらにショット数を増やしていくと、ボールの落下位置はカップの回りに均等にばらつくような結果となりました。この平均位置をとれば、カップの位置となるでしょう。

これは、不偏とは別ものです。データをたくさん集めて、標本サイズnを十分に大きくすれば、推定値は母集団の真の値に収束していくことが一致性です。

不偏性がある場合には、標本サイズは小さくてもよいが、一致性があっても、標本サイズが小さい場合には、推定値と母集団の真の値と一致していない可能性があります。

これも母集団を推定するにあたっては、不偏性と一致性が重要な性質となります。