平均というと、各データを足し合わせてデータ数で割って計算する平均値が思い浮かんできます。平均身長や平均得点など、平均という数値はいたるところで目にしますよよね。
これらの平均は、正確には算術平均といいます。
私たちがよく見たり使ったりする平均は算術平均である場合が多いですが、実は平均には他にいくつかの種類があります。
算術平均のほかに、加重平均・幾何平均・移動平均などがあり、場合によっては、算術平均ではなくて他の平均を使うほうが適切なことがあります。
この記事は、算術平均・加重平均・幾何平均・移動平均の違いと使い分けについて書きました。
算術平均(相加平均)(average)の意味と計算方法
算術平均とは、個々のデータを全て足し合わせて、データの総数で割ったものです。
x と y の算術平均の計算式は、次のとおりです。
$$\bar{x}=\frac{x_1+x_2}{2}$$
データxが5個ある場合は、
$$\bar{x}=\frac{x_1+x_2+x_3+x_4+x_5}{5}$$
または、
$$\bar{x}=\frac{1}{n}\sum_{i=1}^{5}x_i$$
データxがn個あるとしたら、
$$\bar{x}=\frac{x_1+x_2+…+x_n}{n}$$
または、
$$\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_i$$
このような計算式となります。
身の回りで最もよく使われる平均値で、一般的に「平均」といえば算術平均のことを指します。
日本人の平均身長・平均体重、クラスの平均テスト得点、月の平均販売数など、いたるところで使われていますよね。
下記の記事で、平均値の特徴を説明しています。
参考記事 代表値とは?平均値、中央値、最頻値の違いと使い分けを紹介
加重平均(weighted mean)の意味と計算方法
加重平均とは、それぞれのデータに重みづけをして計算する平均値です。
データx1、x2、x3、それぞれの重みがw1、w2、w3 とすると、加重平均の計算式は次のとおりです。
$$x_w=\frac{w_1x_1+w_2x_2+w_3x_3}{w_1+w_2+w_3}$$
または、
$$x_w=\frac{w_1x_1}{w_1+w_2+w_3}+\frac{w_2x_2}{w_1+w_2+w_3}+\frac{w_3x_3}{w_1+w_2+w_3}$$
データxがn個、それぞれの重みwもn個分あるとしたら、
$$x_w=\frac{w_1x_1+w_2x_2+…+w_nx_n}{w_1+w_2+…+w_n}$$
または、
$$x_w=\frac{w_1x_1}{w_1+…+w_n}+\frac{w_2x_2}{w_1+…+w_n}+…+\frac{w_nx_n}{w_1+…+w_n}$$
となります。
ここで、とある2つの会社「A会社」・「B会社」の2つの会社の給料の平均値を考えてみましょう。
- A社の平均年収・・・400万円
- B社の平均年収・・・500万円
であった場合に、この2社の平均年収の間をとって
「平均年収は450万円である!」
と、するのは算術平均ですよね。カンタンに計算できます。
しかし、この2社の従業員数に違いがあるため従業員数を考慮して平均を計算する場合には、重み付けをして平均を計算しなくてはいけません。これが加重平均です。
仮の話ですが、日本にはこのA会社とB会社しか存在しないとしましょう。そして、A社の従業員数が900人で、B社の従業員数が100人で、計で1000人あるとします。
ここで、日本の平均年収を計算するならば、加重平均を使います。
- 日本の人口は1000人
- A社は1000人中の900人がいる
- B社は1000人中の100人がいる
となっています。A社は900/1000、B社は100/1000の重みづけをすることができます。
A社のほうが9倍重いものであると捉えて、それぞれの会社の平均年収に、この重みをかけるわけです。そして、それらの結果を足し合わせれば、加重平均が求められます。
$$400\times\frac{900}{1000}=360$$
$$500\times\frac{100}{1000}=50$$
$$360+50=410$$
360と50を足し合わせて計410万円です。これがそれぞれの会社の従業員数を加味した加重平均値です。
そして、日本にはこのA会社とB会社の2社しかないとしたら、410万円が日本の平均年収となります。
参考記事 加重平均の意味と計算方法
幾何平均(geometric mean)の意味と計算方法
幾何平均とは、データを全てかけ合わせて、データ個数でルートを開いたもので、相乗平均ともいいます。
10と20の二つのデータの幾何平均の計算式は、次のとおりです。
$$x_G=\sqrt[2]{10\times20}$$
10、20、30の三つのデータの幾何平均は、
$$x_G=\sqrt[3]{10\times20\times30}$$
n個のデータの幾何平均は、
$$x_G=\sqrt[n]{x_1\times x_2\times…\times x_n}$$
となります。
変化率で表されるデータの場合に用いる代表値は幾何平均が望ましいです。
伸び率等の比率(%)データがそうですね。平均を出す場合には幾何平均を使用します。
参考記事 幾何平均(相乗平均)の意味と計算方法~伸び率の平均を調べる~
移動平均(moving average)の意味と計算方法
移動平均とは、変化しているデータに使うもので、ある期間のデータの和をデータ個数で割ったものです。
基準のデータをxt とし、前後k期間ずつデータを使用すると、移動平均の計算式は次のとおりです。
$$y_t=\frac{1}{2k+1}(x_{t-k}+…+x_t+…x_{t+k})$$
日々の最高気温、5日分の移動平均をとるとしたら、基準の日をxt として、その ±2日分をつかって計算します。
$$y_t=\frac{1}{5}(x_{t-2}+x_{t-1}+x_t+x_{t+1}+x_{t+2})$$
時系列データにおいて、どのような推移なのかを見るとき、今後の傾向を確認したいときに活用されます。
参考記事 移動平均で時系列データの推移を読み取る