データ集めの最中は、結果をあまり意識しないほうがよいだろうという話

データのとり方は事前に定めておき、今集めているこのデータを使った分析結果についてを意識せず、実施時は作業に集中することがよいだろう、という話です。

データ分析では、仮説どおりの結果がほしくなるのがふつう

データ分析をするときには、まず仮説を立てます。

  • 「ひょっとしたらこういうことが言えるのでないか」
  • 「もしそうであれば、この問題が解決できるぞ」

それを確認するためにデータをとって分析してみるような形になります。

データ分析はまず仮説を立ててから始める。仮説どおりの結果が得られれば、なにかの発見があり、問題解決につながったりする。

ですから、仮説どおりの結果がほしいのは当たり前です。データを収集しているときには、どうしても、自分が求めるほうへとデータを変えたくなる衝動に駆られるのはゼロではないはす。

たとえば、製造工場でいくつかの要因を変えて製品がどうなるか、実験をしたとします。製品サイズを大きくしたいと思っていて、仮説として、この要因の変化によって、製品サイズが大きくなるだろうと考えました。

実験後に測定する製品のサイズは、大きい値のほうが望ましい状況だということです。測定するときに、目盛りと目盛りのちょうど間を指していることがあったら、大きい側の測定結果としてしまう…

あるいは、アンケート調査をしているときに、自分が立てた仮説にそった回答がほしいがゆえに、誘導的な質問をしてしまいたくなるかもしれません。

このようにな誘惑が生まれる可能性は、ゼロではないでしょう。

データの操作を正当化してしまう

仮説を立証できそうなほうへと、データを操作したくなってしまうわけです。こわいのは、これでいいんだと、正当化してしまうところでしょう。微妙なラインのことであったら、自分の望むほうに少しだけデータを変えてしまっても、「微妙だったからね。こっちでいいんだよ」となってしまいそうです。

これは、もちろんやるべきではありません。

データを集めるときには、その作業だけに集中する

では、どうすればいいのか。

それは、データをとるときには、純粋にその行為に集中することです。

「私が立てた仮説では、このデータはこうなるはずで…、こういった傾向があるはずで…」などと考えながら、データをとっていると、

データを分析する者としては、こうだったんだと言えるような結果が欲しいじゃないですか。だからデータをとっているときにも、こんな結果になるかなとか考えながらやってしまいます。これがダメなんですね。

そのようなことを考えずに、もともと設計していたやり方で正確にデータをとることを意識して作業をする。恣意的にデータ集めをしないためによいと思いますね。単純にデータを正しく集めることに集中するのです。

アンケート調査などもそうですね。対面でのアンケート調査では、質問に仕方によって、相手の返答を誘導できてしまいます。私は詳しくないですが、心理学に長けたひとにとっては、難しくないのでは?

「こういった返答がほしいな」と思いながら質問していると、意識せずとも、その方向に返答をするように話をしてしまいそうです。事前に設計したとおりの質問内容、質問の仕方で正しくやることだけを意識するべきです。

ウソついてよい結果に仕立て上げても、意味がありません。上記の例でいえば、製造工場での実験結果でデータを操作してよい結果が得られても、製造工場にとって何もプラスになりません。自分はいい実験・分析ができましたと一時的に言えるだけです。

フォローする