簡易的に比率の誤差を信頼係数95%で計算する方法




視聴率のような比率の

標本サイズnの比率pの標準誤差は、

$$\sqrt{(p×(1-p)/n)}$$

で計算することができます。

標本の比率は、母集団の比率からどのくらいの誤差が発生する可能性があるか。

信頼係数95%で考えると、

$$1.96\times\sqrt{(p×(1-p)/n)}$$

で計算することができます。

下記にあるように、「$(p×(1-p)$」は、$p=0.5$のときが最も値が大きくなります。標本比率が0.5のときが誤差が一番大きくなるわけです。

0.1×0.9=0.9
0.2×0.8=0.16
0.3×0.7=0.21
0.4×0.6=0.24
0.5×0.5=0.25 ☆
0.6×0.4=0.24
0.7×0.3=0.21
0.8×0.2=0.16
0.9×0.1=0.09

p=0.5のときは、

$$1.96\times\sqrt{(0.5×0.5/n)}$$

で計算できます。

簡易的に計算することが目的であれば、標本比率が0.4 や0.3 であったとしても、標本比率は0.5 であるとして計算をしてしまいましょう。

比率p=0.5 のときに、もっとも標準誤差が大きくなります。p=0.5 から小さくなるか、または大きくなると、

標準誤差を小さくするほうに計算するのはよくないですが、 大きく出るようになるので(誤差を大きく見積もることになるので)、まあよしとします。

信頼係数95%の範囲は、標準誤差に1.96 を掛けます。1.96は、ほぼ2 ですから、これも簡易的に考えて、小数点を四捨五入して2 としてしまって計算すると、

$$2\times\sqrt{0.5×0.5/n}\\=2\times\sqrt{0.25/n}\\=2\times\frac{\sqrt{0.25}}{\sqrt{n}}\\=2\times\frac{0.5}{\sqrt{n}}\\=\frac{1}{\sqrt{n}}$$

となります。

比率の誤差をざっくり計算する場合は、誤差範囲が一番広くなってしまうp=0.5で計算することにすれば、

$$\frac{1}{\sqrt{n}}$$

だけでよくなります。標本のデータ数nをあてはめれば、1.96×標準誤差が算出できます。

これ以上は大きくはならない数値が出てきます。もっとも誤差範囲が広く出るように計算されているわけです。簡易的に計算したいだけであれば、これでいいでしょう。

n=100 であれば、

$$\frac{1}{\sqrt{100}}\\=\frac{1}{10}\\=0.1$$

±10%の誤差、となります。

n=400 であれば、

$$\frac{1}{\sqrt{400}}\\=\frac{1}{20}\\=0.05$$

±5%の誤差、となります。