簡易的に比率の誤差を信頼係数95％で計算する方法

視聴率のような比率の

標本サイズｎの比率pの標準誤差は、

$$\sqrt{(p×(1-p)/n)}$$

で計算することができます。

標本の比率は、母集団の比率からどのくらいの誤差が発生する可能性があるか。

信頼係数95％で考えると、

$$1.96\times\sqrt{(p×(1-p)/n)}$$

で計算することができます。

下記にあるように、「$(p×(1-p)$」は、$p=0.5$のときが最も値が大きくなります。標本比率が0.5のときが誤差が一番大きくなるわけです。

0.1×0.9＝0.9
0.2×0.8＝0.16
0.3×0.7＝0.21
0.4×0.6＝0.24
0.5×0.5＝0.25 ☆
0.6×0.4＝0.24
0.7×0.3＝0.21
0.8×0.2＝0.16
0.9×0.1＝0.09

p＝0.5のときは、

$$1.96\times\sqrt{(0.5×0.5/n)}$$

で計算できます。

簡易的に計算することが目的であれば、標本比率が0.4 や0.3 であったとしても、標本比率は0.5 であるとして計算をしてしまいましょう。

比率ｐ=0.5 のときに、もっとも標準誤差が大きくなります。p=0.5 から小さくなるか、または大きくなると、

標準誤差を小さくするほうに計算するのはよくないですが、大きく出るようになるので（誤差を大きく見積もることになるので）、まあよしとします。

信頼係数95％の範囲は、標準誤差に1.96 を掛けます。1.96は、ほぼ2 ですから、これも簡易的に考えて、小数点を四捨五入して2 としてしまって計算すると、

$$2\times\sqrt{0.5×0.5/n}\\=2\times\sqrt{0.25/n}\\=2\times\frac{\sqrt{0.25}}{\sqrt{n}}\\=2\times\frac{0.5}{\sqrt{n}}\\=\frac{1}{\sqrt{n}}$$

となります。

比率の誤差をざっくり計算する場合は、誤差範囲が一番広くなってしまうｐ＝0.5で計算することにすれば、

$$\frac{1}{\sqrt{n}}$$

だけでよくなります。標本のデータ数ｎをあてはめれば、1.96×標準誤差が算出できます。

これ以上は大きくはならない数値が出てきます。もっとも誤差範囲が広く出るように計算されているわけです。簡易的に計算したいだけであれば、これでいいでしょう。

ｎ=100 であれば、

$$\frac{1}{\sqrt{100}}\\=\frac{1}{10}\\=0.1$$

±10％の誤差、となります。

ｎ=400 であれば、

$$\frac{1}{\sqrt{400}}\\=\frac{1}{20}\\=0.05$$

±5％の誤差、となります。