データの見かけ上は相関関係があっても、実は関係がないものを「見かけ上の相関」といいます。
または「見せかけの相関」、「擬似相関」ともいいます。
統計的な数字だけをみて現実を考えない人は、見かけ上のの相関にだまされて、間違った理解をして意味のない行動をしてしまいます。
たとえば、このような場合です。ある会社のビジネスマンの体重と年収のデータを見てみたら、その間に相関関係がありました。
相関係数はR = 0.61
相関係数からは「正の相関がある」といえますし、なにか関係がありそうな数値です。
なるほど、ビジネスマンは体重があって体が大きいほうが相手に安心感を与えるとか、 信頼されやすいとかあるのかもしれない。よくご飯を食べて体を大きくしよう、と考えてしまうかもしれませんね。
しかし、こんなふうに考えてしまうのは間違いの可能性があります。年収を挙げているのも、体重を増やしているのも、ひょっとしたら…、
“加齢”が原因なのかもしれません。
それは、こういうことです。
- 年齢が上がると、お腹が出てきて、体重が増加する人が多い
- 年齢が上がると、新人のときよりも仕事ができるようになって収入も増加する人が多い (あるいは年功序列で収入が増加する人が多い)
年をとることによって、体重も増加するし、収入も増加することから、体重と年収に相関関係が見られた可能性がありますね。
データだけを見れば相関関係があっても、実は別の要因がはたらいていて、一方が大きくなれば、もう一方も大きくなっているだけ。このような相関を、見かけ上の相関とか、擬似相関と呼びます。
でも、体重と年収にほんとうは関係があるのかも…、という疑問もあります。
もしかすると、あるのかもしれません。年齢は関係ないことをデータによって証明するにはどうしたらいいのでしょうか。
この場合であれば、年齢の要因を除去して、体重と年収の関係を見てみます。
各年代別で体重と年収の関係性を見てみましょう。
- 20歳の体重と年収の関係
- 21歳の体重と年収の関係
- 22歳の体重よ年収の関係
- ~
- 68歳の体重と年収の関係
- 69歳の体重と年収の関係
- 70歳以上の体重と年収の関係
と、年齢で区分けをして見てみるのです。どの年齢のなかでも、体重が増えると、年収も増えるという関係が見られたら、年齢は関係ないと言えますね。
上に書いたような単純な例であればわかりやすいのですが、仕事の現場で発生する現実の問題は、さまざまな要因が入りまじって発生しますから、見かけ上の相関に気をつけなければなりません。
上手いこと相関のある数値が出てきて、「おっ、これは関係があるのか!」と喜びたくなっても、ちょっと立ち止まりましょう。見かけ上の相関にだまされて、間違った理解をしてしまわないように注意です。
相関係数の数値だけで物事を判断するのでなく、その裏にどういった現象があるのかもしっかりと考えます。