視聴率はどのように計算されているのか。またその誤差について




視聴率とは、あるテレビ番組がどのくらいの世帯、人々から見られているかを示す数字です。

人気のあるテレビドラマ、スポーツの大会、大事件に関する特番など、国民の関心の高さを推し量ることができます。 新しいドラマが始まると、「初回視聴率○○%」と人気度を測る数字として示されることになりますね。

人々の関心が高いオリンピックやワールドカップ、年末の紅白歌合戦など、多くの人が見る番組は視聴率が跳ね上がっています。CMを流すスポンサーにとっては、たくさん見てくれる人がいるほど、広告の効果が高まるわけですから、 視聴率は気になるところですし、テレビ局としては高い視聴率をとれれば、スポンサーを集めることがしやすくなります。

この視聴率の算出にも統計学が用いられています。サンプリングや推定を利用しているのです。

視聴率の調査方法

視聴率の調査方法は、専門の調査会社が家庭のテレビに機械を設置し、記録されたデータを通信回路経由でデータセンターに集める、また、 直接訪問によってアンケート調査票への記入記録を集めるなどして、どの番組がどれだけ見られているかを調べています。

サンプリング方法

日本全体の視聴率を調べようと思ったら、全世帯に機械を設置したり、日本全国津々浦々を巡って各家庭を訪問する必要があり、時間も労力もかかりすぎます。

とてもじゃないですがそれはやっていられないので、日本全体から標本を選び出して調査をしています。サンプリングを行っているわけです。

調査対象数は、関東地区、関西地区、名古屋地区で世帯を選び出すなどし、系統サンプリング法で標本を選んでいるようです。※専門調査会社のWEBサイトより

参考記事 色々あるサンプリング方法の種類

視聴率20%の意味

視聴率20%といわれると、結構な人気番組だなあと思いますよね。

数字としては「20%」と出てきますが、実はこの番組の本当の視聴率は、19%かもしれないし、21%かもしれない。そういう可能性があります。

なぜなら、視聴率の調査は、おおよそ5000万世帯のうち、一部の世帯だけが調査対象となっており、5000万世帯すべての調査結果と、一部の世帯を調査した結果では、誤差が生まれるためです。

仮に600世帯のみ調査をしたとして話をすすめていきましょう。

全体ではなく一部分の調査しかしておらず、5000万世帯中、600世帯だけの調査の結果では、「視聴率20%です。すごい番組でしょ?」とはいっても、日本全体の5000万世帯の視聴率も20%になっているとは限りません。

あくまでも600世帯を調査した結果が20%だっただけです。5000万世帯を調査した結果と600世帯を調査した結果では、当然のように誤差が出てきます。

では、どのくらいの誤差が出てしまうのでしょうか。そこが問題です。わずかな誤差であればいいのですが、 5%も10%も誤差が出てきてしまうのであれば、「視聴率20%」の数値は信用できないですよね。

誤差の計算

標本調査によって得られた視聴率は今回は20%でしたが、なんども標本調査を行って各回の比率を出すとすると、誤差が生まれて、19%になったり、21%になったりすることもあるでしょう。

標本の平均の標準偏差のことを標準誤差といいます。(また、標本の比率の標準偏差のことを、標準誤差)

このような比率の誤差を計算するときは、標準誤差で考えることができます。

標本視聴率をpとすると、データ数をnとすると、

$$\sqrt{p×(1-p)/n}$$

標本サイズ(データの個数)n は600、標本の視聴率pは0.2ですから、

$$\sqrt{0.2×(1-0.2)/600}$$

標本比率の標準偏差σは、0.016になります。%に直すと1.6%です。

比率の標準誤差から本当の視聴率の範囲を推定する

正規分布では、

  • データの68.26%が標準偏差1つ分(1σ)に含まれる
  • データの95.44%が標準偏差2つ分(2σ)に含まれる
  • データの99.74%が標準誤差3つ分(3σ)に含まれる

ことになります。

上の視聴率の話では、標準偏差σ は1.6%です。600世帯の視聴率は20%でしたが、日本全体の実際の視聴率は68.26%の確率で20%±1.6%の範囲におさまると考えられます。

日本全体の5000万世帯の(母集団)の視聴率は、標本調査の結果である視聴率20%から、

  • 68.26%の確率で標準誤差1つ分の範囲に含まれます。
  • 95.44%の確率で標準誤差2つ分の範囲に含まれます。
  • 99.74%の確率で標準誤差3つ分の範囲に含まれます。

標本の視聴率から標準誤差1個分つまり1σ分の範囲は、62.26%の確率で実際の視聴率がおさまる誤差範囲です。38%くらいはこの誤差範囲からはずれてしまうわけです。

もっと高い確率でおさまる範囲を知りたいですね。その範囲におさまる確率を上げようとするなら、範囲を広げないといけません。

通常は、95%の確率でどのくらいの誤差範囲におさまるかを考えます。この範囲から外れている可能性は5%です。外れるのは5%くらいの小さい確率にしておこうと考えて設定するわけです。

標準誤差1.96コ分の範囲にすると、標本比率はそこに95%の確率でおさまりますが、この「1.96」の数字を、「2」で計算してしまう場合もあります。その場合、標準偏差2コ分の範囲で、そこに95.44%の確率でおさまるようになります。この方が簡単に計算できますし、ほぼ95%ですから数字的な問題はありません。

95%の信頼区間は、

$$1.96×\sqrt{(0.2×0.8)/600}=0.032$$

誤差3.2%です。95%の確率で、日本全体の視聴率は標本視聴率の20%から前後3.2%の範囲になるわけです。

「95%の確からしさで、日本全体の視聴率は16.8%~23.2%の範囲に含まれる」

形式ばった言い方をするとこのようになります。

「○○番組の視聴率は視聴率20%」といわれるのは、あくまで標本の600世帯の視聴率が20%なのです。日本国全体の視聴率は20%ちょうどではなく、実は若干の誤差があり、20%からずれて19%や21%になっている可能性があります。

※日本の視聴率を調査している会社ではもっと多くの調査数があるようですので、誤差はこれよりももっと少なくなります。このページでは、調査世帯数を600として誤差の説明をさせていただきました。

コメント

  1. […] 今回、「PV(ページビュー)」についてご紹介させて頂きました。「PV(ページビュー)」について、色々と調べている中でTVを見ない自分ですが、TVの視聴率の計算方法が出てきた時は「そうなっているのか!」と日常の素朴な疑問が解決できました(笑)。ぜひ、皆様もそういった普段調べないような日常の素朴な疑問があったら調べてみて下さい。ちなみに、自分は視聴率の計算方法は「こちら」が分かりやすかったです。 […]