層別サンプリングとは、母集団をいくつかの層に分けてその中からランダムサンプリングする方法です。
母集団の中に構成がある場合には、単純なランダムサンプリングを行うと、サンプルが母集団の構成を必ずしも上手く表すことができないことがあります。その母集団を構成を見ていくつかの属性によってグループ分けし、その中からランダムにサンプリングをする方法が適しています。
この属性のことを層といい、各層ごとにランダムサンプリングするこの方法が層別サンプリングです。
いくつかの層が存在するのであれば、それによってループ分けして層の大きさに比例させて調査対象を抽出するのがいいです。
大学生の住まいや通学に関するアンケート調査をするとしましょう。
ある大学の学生数は1000人で、男女の比率が8:2となっていました。ここから100人を選んで調査をします。
男性か女性かによって住まいや通学事情に差がありそうです。男性の方が一人暮らしが多いとか何らかの違いがあるかもしれません。
100人の調査結果から母集団である大学生1000人の実態を推測するとしたら、男80人:女20人の数で調べるのがよいです。
ランダムサンプリングで仮に男50人:女50人の半々の対象を選ぶこととなりアンケートをしたらどうなるでしょうか。調査から得られた結果は、母集団の1000人全員を調査したときの結果よりも女性の影響が大きくなってしまいます。
男子学生から80人をランダムサンプリングで選び出し、女子学生から20人を同じくランダムサンプリングで選び出すようにすれば、サンプルの男女構成が、母集団の男女構成と同じにできます。
男子学生という層と、女子学生という層に分けてサンプリングするわけです。
層の分け方によって、
- 層内のばらつきを小さく
- 層間のばらつきを大きく
することができると、層別サンプリングの効果がよく得られて標本誤差が小さくなります。
男性か女性なのかによって調査結果が異なるのであれば、標本の男女比率を母集団と同じに合わせたほうが、層内のばらつきは小さく、層間のばらつきは大きくなります。