相関関係と因果関係の違い。第3因子に注意しよう




相関係数と因果関係は、次のような関係です。

  • 相関関係は、一方が増えるともう一方も増える、一方が減るともう一方も減るという関係
  • 因果関係は、その名前の通り、ある2つの出来事が原因と結果で直接結びついている関係

ものごとの関係性をデータで見てみるときには、これらをきちんと分けて把握することが大事です。

相関関係は数字だけでの解釈

2つの変数に関係性があることは相関関係も因果関係も同じです。しかし、相関関係があれば因果関係もあるわけではありません。原因と結果で結ばれていなくて因果関係が無かったとしても、相関関係はありえるものです。

2つの変数の関係性を数値で把握する相関係数は、数学的な解釈です。片方の変数xが増えれば、もう片方のyも増えるよとか、片方の変数xが増えれば、もう片方の変数yは減るよ、ということを数字で示しているだけです。

相関関係が顕著に見られる場合でも、まったく別の変数から影響を受けて、xとyがそれぞれ別々に増加しているだけのこともあります。

たとえば、ある家庭で「コタツで食べるミカンの量」と「猫がコタツで寝る時間」を分析したところ、この2つに高い相関係数が見られました。ここに因果関係があるならば、コタツでミカンを食べたから猫が寄ってくるようになったのだ、ということになってしまいます。

しかし、そんなことはないのはわかりますよね。単に寒くなってきたから、ミカンが市場に出回り、購入して食べるようになり、外は寒いので猫は温かいコタツの中に入る。

この例では、「コタツで食べるミカンの量」が原因で「猫がコタツで寝る時間」が増えたとは、まず考えないと思いますが、仕事のなかの話では数字として相関があるだけのことを、因果関係があると捉えてしまうことが少なくありません。

冬になって寒くなったからコタツでミカンを食べるようになり、冬になって寒くなったから猫がコタツで寝る時間が増えた。

この冬になって寒くなったことが原因として働いているわけで、このように共通の原因になっているものを、第3因子と呼びます。

相関係数を算出して2つの出来事の関係性を見るときには、表面の数字だけを見て関係性を捉えるのではなく、その数字の裏に何があるのかを読まないといけません。

因果関係は、原因と結果でつながっている

  • 毎日食事の量を1/2に減らした
  • 体重が減った

この2つには因果関係があります。原因があり、そのあとに結果が起こっています。

「食事の量を減らした→体重」が減ったという「原因→結果」の流れがあります。

2つの出来事がどのくらい関係しているのか数字を出すこと、統計学ができることはここまでです。統計学をつかって出した数字に、業界知識や技術知識、人間の観察、思考によって意味や解釈を加えて活用していくのです。