情報バイアスとは




情報バイアスとは観測方法によって生じるバイアスです。

調査対象者にその人自身の情報を質問をしたとき、正直に答えにくいことは、過小、あるいは過大に答えることがあります。

たとえば、「あなたの貯金額はいくらですか?」の問いにたいして、私であれば、その額が少ないですから、多少盛って答えてしまいそうです。

「あなたはタバコを吸いますか?吸うのであればどのくらい吸いますか?」という問いはどうでしょう。タバコの吸っているのを隠したいと思う人もいそうです。

年齢をサバ読みするのもこの一種といえそうです。

あるいは、医学におけるバイアス。Aという病気があって、その病気を患ったことがある人の家族にもそのAの病気が多いかどうかを調べるために、「あなたの家族にAの病気になった人はいますか?」と質問するとします。

  • Aの病気にかかったことがある人に質問したとき
  • Aの病気にかかったことがない人に質問したとき

の2つの結果を比較すると、前者のほうがYesと答える率が上がります。

なぜなら、Aの病気になったことがある人のほうが、Aの病気に関して情報を持っているので、家族がその病気になっていることに気が付きやすいです。

家族が病気にかかったことがあるかどうかの割合は、Aの病気にかかったことがある人の場合のほうが、家族もその病気になったことがあると答える率が高くなるという偏りが生じます。これは家族情報バイアスと呼ばれます。

参考記事 統計学のバイアス(偏り)の意味。認知バイアスとは違います

統計学で言うバイアスとは日本語でいえば「偏り」で、観測値から得た母集団の推定値と、真の値との間にある偶然にできたものではないズレのことです。これは、偶然の誤差とは異なるもので、系統的に発生してしまう誤差です。