CORREL 関数とPEARSON 関数の違い

一方が大きくなると、もう一方も大きくなるなど、関連した動きをする2つの変数の関係を、相関関係といます。

相関関係がどのくらい強いのかを数字で示したものが、相関係数です。

相関係数は、エクセルの関数で計算できるのですが、相関係数を計算する関数には、CORREL 関数とPEARSON 関数の2つがあります。

エクセルのヘルプなどもを見て調べてみても、どこがどう違うのかいまいちわからない、という方のために、これら2つの関数の違いについて説明します。

CORREL 関数とPEARSON 関数の違い

エクセルのヘルプに記載された説明を見てみます。

CORREL 関数

配列 1 および配列 2 のセル範囲の配列データの相関係数を返します。

相関係数は、2 つの特性の関係を判断するときに使用します。たとえば、各地域の平均気温とエアコンの普及率の相関関数を調べることができます。

書式

CORREL(配列 1, 配列 2)

CORREL 関数の書式には、次の引数があります。

配列 1    必ず指定します。データが入力されたセル範囲を指定します。

配列 2    必ず指定します。もう一方のデータが入力されたセルの範囲を指定します。

PEARSON 関数

ピアソンの積率相関係数 r の値を返します。

r は -1.0 から 1.0 の範囲の数値で、2 組のデータ間での線形相関の程度を示します。

書式

PEARSON(配列 1, 配列 2)

PEARSON 関数の書式には、次の引数があります。

配列 1    必ず指定します。 複数の独立変数に対応するデータを指定します。

配列 2    必ず指定します。 複数の従属変数に対応するデータを指定します。

上記の文章を見ると、

  • CORREL 関数・・・「配列 1 および配列 2 のセル範囲の配列データの相関係数を返します。」
  • PEARSON 関数・・・「ピアソンの積率相関係数 r の値を返します。」

文言として、相関係数を表示するのか、ピアソンの積率相関係数を表示するのか、の違いです。

この2つは、実は、同じものです。

相関係数=ピアソンの積率相関係数、なのです。

・・・配列 1 および配列 2 のセル範囲の配列データの相関係数を返します。

・・・ピアソンの積率相関係数 r の値を返します。

の文言は、同じことを言っていることになります。実際に計算してみると、CORREL 関数で計算した結果と、PEARSON 関数で計算した結果は同じになります。

相関係数の種類

相関係数には、いくつかの種類があります。

  • ピアソンの積率相関係数
  • 相関比
  • クラメールの連関係数
  • スピアマンの順位相関係数

です。

たんに相関係数というと、ピアソンの積率相関係数を指すのが一般的です。

ここに10人の身長、体重のデータがあります。ためしに計算してみましょう。

CORREL 関数で計算。

PEARSON 関数で計算。

CORREL 関数、PEARSON 関数、ともに0.8068 となりました。どちらで計算をしても同じ値になるとわかりました。

参考:相関関係の意味と相関係数の計算方法

参考:データ尺度の違いによる相関関係を数値化する方法の種類

フォローする