標準誤差の意味

シェアする

標本平均の標準偏差のことを「標準誤差」といい、ここが統計学入門の肝になります。

母集団から標本データとして10個のデータを抜きとって、標本平均を計算します。これを100回繰り返すことを考えてみましょう。

道行く男性をランダムに選んで、身長を測らせてもらい、30の身長データを集めたとします。その平均は170.6cmでした。

もう1回、道行く男性30人の身長を測らせてもらってその平均を出すと、今度は171.8cmでした。さっきよりも、背の高い人が多く含まれていたのでしょう。

こんな具合で、「男性30人の身長を測って平均を出す」ことを100回繰り返します。すると、30人の平均身長が、100個分できますよね。

標本平均である30人の平均身長は、100個つくられ、大小さまざまな値となり、分布をします。ばらつきを持っているわけです。「標本平均である30人の平均身長」の標準偏差が、標本誤差です。

で、この標本誤差は、もともとの母集団の標準偏差よりも、小さい値になります。もともとの母集団、男性一人一人の身長を見れば、160cmの人もいれば、180cmの人もいるわけです。※5.5cmくらいの標準偏差のようです。

しかし、30人分ひとくくりにした平均値は、160cmの人も、180cmの人もうまい具合にまざって、だいたい日本全体の平均身長である170cm前後くらいになるでしょう。この平均値は、160cmとか180cmになることはまずなさそうですよね。170cm前後で分布しそうです。

標本の大きさ(抜きとるデータ数)が小ければ、この例でいると、身長を測る人数が2人とか、3人であれば、たまたま背の低い人だけを選んでしまい、その標本平均が低めに出てしまうことはそこそこ発生するでしょう。

でも、標本の大きさを大きくし、測る人数を10人、20人と増やしていくほど、計算した標本の平均身長が低めに出ることは少なくなっていくのはわかりますよね。逆に大きく出ることも減ります。

標本の大きさ(サンプルサイズ)が30個の場合、

  • 標本平均値は、μ
  • 標本平均値の標準偏差は、σ/√30

の分布をすることがわかっています。この標本平均の標準偏差のことを「標準誤差」と呼びます。

標本の大きさ(サンプルサイズ)がn とすれば、

  • 標本平均値は、μ
  • 標本平均値の標準偏差は、σ/√n

の分布に従います。標準誤差は、もとの母集団の標準偏差にくらべて、1/√n の値に小さくなるのです。