アンケートを調査するとき、回答者からしたら、正直に答えにくい質問、正直に答えたらヤバイから絶対にウソをつくような質問があるでしょう。
たとえば、
- 飲酒運転したことはあるか
- 浮気したことはあるか
- 飲酒したことはあるか(未成年に対して)
- 麻薬をつかったことはあるか
といった質問をされて、もし行ったことがあったとしても、「はい」と答える人はまずいませんよね。「この結果はあなたのものであることを公表しませんよ」と伝えたとしても、本当はやったことがあるのに、やったことはないとウソをつく可能性が高いです。
得られた結果から推測した結果は、真の割合よりも小さくなってしまい、つかえない調査結果になってしまいます。
社会的な問題を解決していくには、ものごとの実態を把握することが大事です。だから、こういったアンケート調査をするわけで、なんとかしてこの情報を知ることをはできないかと考えるわけです。
調査する側としては、知りたいことは誰が行ったかということでなくて、その割合です。何%の人が行っているのかを知って、実態を把握したいわけです。調査側は誰が「はい」と答えたのかは知る必要はありません。
回答する側としては、「はい」と答えたことを知られたくないのです。調査者・インタビュアーだったら聞かれてもよいとも思わず、調査者、インタビューアーにさえもわからないようにしないと、回答者は真実を答えてくれないでしょう。
このようなときに活用できるのが回答のランダム化です。あるいはランダム回答法ともいいます。回答者のプライバシーを守りつつ、「はい」と答える人の割合を調べることができます。
回答のランダム化の手順
「飲酒運転をしたことがありますか?」
という質問をして回答者に答えてもらうとします。これはYESとは答えにくい問題ですよね。シンプルな回答のランダム化として、つぎのような手順があります。
回答のランダム化の手順
- まず、回答者にコインを投げてもらい表か裏か確認してもらう
- 表が出た人は、自分の答えがどちらであろうと「はい」と答える
- 裏面が出た人は、質問に対して正直に「はい」か「いいえ」を答える
- 「はい」と答えた人数から、回答者全員の半数を引いた値を推定値とする
コインを投げて表が出る確率は1/2です。表が出た人は、「はい」と答えてもらいます。裏面が出た人には、真実を答えてもらうのです。
ここで重要なのは、コイン投げの結果で表が出たのか、裏が出たのは、他の回答者にも質問者にも誰にもわからないようにすることです。
そうすれば、本当に飲酒運転したことがある回答者が「はい」と答えても、コインが表だったから「はい」と答えたのか、本当にそうだから「はい」と答えたのか、質問者には区別がつきません。
回答者としては、誰にも知られないのですから安心して本当のことを答えることができるのです。
表が出たら「はい」と答えるのですから、他にも「はい」と答える人がたくさんいますしね。
回答者が安心して答えることができるように、事前にこの仕組みについてもきちんと説明しておきます。
結果の見方
それで、結果を出すときにはどうするか。
100人に対して「飲酒運転をしたことがありますか?」と質問し、その結果、60人が「はい」と答えたとします。コイン投げで表が出る確率は1/2 ですから、100人中50人は表であったから「はい」と答えたと推定できます。
ですから、「はい」と答えた人数の60から、50を引いた人数が、本当に飲酒運転をしたことがあるから「はい」と答えた人数だろうと、推定できるわけです。
「いいえ」と答えにくい質問である場合は、この逆になります。コインで表が出たら「いいえ」と答えてもらうようにしておけば、同じように「いいえ」と答えた人数から、50を引けば、本当に「いいえ」と答えた人数になります。
回答者数が少ないと推定に信頼がおけなくなる
ところで、コイン投げをして表が出る確率は1/2 ではあるのですが、回答者の数が少ないと、本来の確率とは離れた結果となってしまうことは少なくありません。
たとえば、10人だけに質問をする場合では、コイン投げをする回数は10回だけです。10人中8人以上がコイン投げで表を出してしまう可能性は、5.5%あります。10人中7人以上が表を出す確率だと、17.2%もあります。
上記した飲酒運転の質問に対して、本当に飲酒運転をした経験がある人が10人中、1人だけだとします。コイン投げの結果で10人中8人が表が出て「はい」と答え、飲酒運転をした人は裏面が出て真実として「はい」と答えたとしましょう。
こうなると、「はい」と答えたのは10人中9人であり、ここから回答者数の半分である5を引いたら4 になります。10人中4人、つまり40%が飲酒運転をしたことがあるという結果になってしまいます。
ランダム回答法の効果が高まるのは、やはり回答者数が多いときですね。大数の法則でわかるとおり、コイン投げの回数が少ないと、表・裏の出る確率が1/2から離れやすくなります。
参考記事 大数の法則をコイン投げの例でシミュレーションして考えてみる
調査人数の半分の数を引いてしまうことになるのですから、コイン投げの結果が回答者の半数にできるだけ近づくようにしないといけませんね。
回答者数が100人であれば、コイン投げで表が出る確率が100人中80人以上となる確率は、ほぼ0 です。100人中70人以上となる確率でも、0.004%程度です。100人中60人以上となる確率でも、2.84%です。回答者数を増やせば、コイン投げの表・裏の出る確率に大数の法則が効いて、1/2の確率に近づきますから、ランダム回答法で得た推定値はより信頼できるものになるでしょう。