単純ランダムサンプリングとは、無作為に標本を選ぶ方法です。無作為抽出ともいいます。
“無作為に選ぶ”とは人の意思の影響がなく偶然によって選ぶことです。
頭で考えると無作為にならない
無作為に選ぶには人が頭で考えて選んではいけません。頭で考えずに何の偏りもなく選ぶことは難しいです。難しいというより不可能なことでしょう。
たとえば、「0から9の数字を無作為に選んで100個並べてみてください」と言われたときに、同じ数字を連続で選ばないようにしたり、0~9の数字を均一になるようにして選んだとします。
頭の中で考えたことなので無作為ではなく作為であるといえます。
無作為に・ランダムに選んだつもりでも、人が頭で考えたものは何らかの規則性なりルールなりが存在してしまいます。
無作為を選ぶには、偶然に選び出す
ある大学の学生1000人に、住まいや通学についてアンケート調査するとしましょう。
1000人全員に対して調査をするのは、大変な労力がかかります。もちろん1000人全員に調査をすれば、正確な結果を得ることができますが、そんなに時間や労力をかけたくないので、100人に対して調査をすることにしました。
1000人から100人をランダムに選び出すのが、ランダムサンプリングです。
無作為に・ランダムに選ぶためには、人が操作できない偶然によって選び出すようにしないといけません。例えばこんなようにします。
学生全員に1から1000の番号を振り、1から1000番までの番号を書いたクジを作りよく混ぜ合わせた後に、クジを100個引く。 選び出されたクジに書かれている番号の学生を、調査対象とする。あるいは乱数表を用いて番号を決める。
といったように、人の意思が入り込まないようにします。
無作為にする理由
日本のテレビの視聴率について標本調査を行ったら20%という結果を得られたとしましょう。
この場合、標本の視聴率は20%ですが母集団(日本全体)の視聴率は20%とはいえません。
ある程度の誤差が生まれてしまいます。標本を抽出(サンプリング)するときに無作為抽出にする理由は、標本誤差の大きさを推測することができる利点があるからです。
参考記事 標本誤差とは