母集団と標本の意味とその違い

シェアする

調査には、身の周りの人へのアンケートのような小規模なものもあれば、社会全体や自然を対象にした調査など大規模なものもあります。日本国民に関する調査、ある山での野生動物の調査といったような対象が大きい調査では、そのすべてを調べるとなると、途方もない時間と労力がかかってしまい、実行することが現実的に難しいですよね。こういったときにサンプリングが活用されます。

母集団と標本

ある化粧品会社が、30代の女性向けの化粧品開発のために、30代の女性にアンケートをとる計画を立てたとします。 日本の30代女性全員にアンケートを実施するのは、現実的ではないですよね。どれだけの時間とお金がかかってしまうのか、想像がつきません。

そのため、このような調査を行う場合は通常、30代女性の中から数百人なり数千人なりを選び出して、そのアンケート結果から30代女性全体が求めている化粧品は何かを考えます。調査対象の全体の集団から、一部を取り出して調べ、その一部から調査対象全体を推定するのです。

調査対象全体のことを母集団といい、そこからデータを得るために選び出した一部分を、標本あるいはサンプルといいます。 母集団から標本を取り出すことを標本抽出、またサンプリングといいます。

この30代の女性向けの化粧品開発のためのアンケートでいえば、

  • 日本の30代女性全体が母集団
  • 実際にアンケートをとった30代女性が標本

です。

テレビの視聴率、世論調査などの社会調査、工場での製品チェックなどでも、このサンプリングが使われています。全体を調べることが不可能だったり、可能であっても時間も費用もかかる場合は、一部分だけを調べて、その一部分の特性値を求めます(特性値とは、平均値や標準偏差、割合%などです)。

その特性値は、全体の母集団の特性値とまったく同じではないにしても、きっと近いはずだと考え、母集団の特性値を理解しようとするのです。

ただ、実際にはサンプルの特性値と母集団の特性値が同じになることはまずありません。データをとるときに何らかの偏りがでてしまったり、上手くデータをとったとしても、母集団データを全て調べたわけではないので、誤差が生まれるのです。

誤差を小さくする方法として、サンプルの誤差を小さくする方法を書いています。