復元抽出と非復元抽出




母集団から標本を抜き取ることを標本抽出(またはサンプリング)といいます。標本抽出には、復元抽出と非復元抽出があります。

復元抽出」とは、なんどかの抽出をする際、抽出したものを1個ずつもとの集団に戻してから、次の抽出を行っていく方法です。

非復元抽出」とは、抽出したものをもとの集団に戻さず、次の抽出を行っていく方法です。集団の構成は抽出するごとに変わっていくことになります。

復元抽出

復元抽出では、母集団の1個1個の要素は互いに独立しています。たとえば、1から10までの番号が書かれたボールが壺の中に入っており、ボール1個を取りだすとします。このとき、1から10番目まで、どのボールも取りだされる確率は同じ、1/10です。

5番のボールを取りだしたとして、これをもとに戻します。次に、ふたたびボールを抜き取るときに、5番のボールを引き当てる確率もその他の番号を抜き取る確率も、変わらず1/10なままです。各要素間での独立性が保たれています。

1回目の抜き取りは、2回目の抜き取りに影響を与えません。

非復元抽出

一方、非復元抽出の場合は、引き当てた5番のボールをもとの集団に戻さないのですから、次のボールを取りだすときには、1~4、6~10の番号のボールがそれぞれ1/9の確率で取りだされることになります。1回目の抜き取りが、2回目の抜き取りに影響を与えます。

ただ、各要素は独立ではないのですが、標本サイズと比較して母集団が大きな場合には、近似的に独立しているとみなすことはできます。

1から1,000,000までの番号が振られているボールを復元抽出で抜き取る場合を考えます。1回目に5番目のボールを引き抜って、これをもとに戻したら、次に抜き取るボールは1から1,000,000番までのどの番号になるか、それぞれ1/1,000,000の確率で各要素で等確率です。

つぎに、非復元抽出の場合を考えてみると、1回目に5番目のボールを引き抜って、これをもとに戻さないことになりますね。次の抜き取りでは、5番以外のボールを抜き取ることになり、その確率はそれぞれ1/999,999です。

1/1,000,000の確率と、1/999,999確率。ほとんど差はないでしょう。近似的に独立していると見なすことができるのですね。