偏相関係数の計算方法

偏相関係数とは、見かけ上の相関であるときに、第3の因子の影響を除いた相関係数のことです。

変数$x$、変数$y$、変数$z$ の三つの変数があり、変数$x$ と変数$y$ の相関には、変数$z$ の影響があるとします。

このとき、変数$z$ は第3因子です。$x$ と$y$ の関係が見かけ上の相関であり、変数zの影響を受けているとします。

見かけ上の相関とは

データの見かけ上は相関関係があっても、実は関係がないものを「見かけ上の相関」といいます。または「見せかけの相関」、「擬似相関」ともいいます。

参考:見かけ上の相関(見せかけの相関、または擬似相関)

変数$z$ の影響を除いたうえでの、変数$x$ と変数$y$ の相関係数が、偏相関係数 $r_{xy・z}$ です。

次の式で計算することができます。

$$r_{xy・z}=\frac{r_{xy}-r_{xz}\times r_{yz}}{\sqrt{1-r_{xz}^2}\times \sqrt{1-r_{yz}^2}}$$

ある会社のビジネスマンの体重と年収のデータを見てみたら、その間に相関関係がありました。

年収を$x$、体重を$y$、年齢$z$

としましょう。

年収$x$、体重$y$の相関係数は、0.90 でした。

体重があるほうが年収が高いといえるのでしょうか…。そうではなくて、ここには、双方に影響を与える第3因子がありました。それが年齢$z$です。年齢が高くなるほど、年功序列で年収が高くなり、男性は中年太りになる人がいる。

年齢$z$が、年収$x$にも、体重$y$にも影響を与えています。

年収$x$、年齢$z$ の相関係数は、0.82

体重$y$、年齢$z$ の相関係数は、0.84

です。

年収$x$、体重$y$ の相関係数は0.90 でしたが、年齢$z$ の影響を取り除いた年収$x$ 、体重$y$ の偏相関係数を計算すると、

$$r_{xy・z}=\frac{0.90-0.82\times 0.84}{\sqrt{1-0.82^2}\times \sqrt{1-0.84^2}}$$

$$=0.68$$

0.68 となりました。

フォローする