サンプリング

サンプリング

統計学でいう漸近的の意味

nが十分に大きいときに、近似的に成り立つことを。漸近的といいます。 たとえば、中心極限定理がそうです。 母集団がどのような分布であっても、標本の大きさが大きければ(抜きとるデータ個数nが大きければ)、標本平均の確率分布は平均値...
サンプリング

測定作業のバイアスとは

測定作業によるバイアスとは、測定によってデータを得るときに、測定機器や測定方法に問題があって発生するバイアスです。 たとえば、ある工場で温度計をつかって、液体の温度を毎日測定をしているとしましょう。この温度計が故障していて、本当に正...
サンプリング

選択バイアスとは

選択バイアスとは調査対象に選ばれたものと選ばれなかったもので、大きな違いがあるときに発生するバイアスです。 とある高校で、学生の身長測定をして、平均値を算出したとします。学生をランダムに選んで測定したのですが、それは、放課後になって...
サンプリング

情報バイアスとは

情報バイアスとは観測方法によって生じるバイアスです。 調査対象者にその人自身の情報を質問をしたとき、正直に答えにくいことは、過小、あるいは過大に答えることがあります。 たとえば、「あなたの貯金額はいくらですか?」の問いにたいし...
サンプリング

測定誤差の原因。作業者による測定誤差に注意

製品の重量やサイズをはかって、製品の規格値を確認するときに気を付けたいことがあります。それは、測定誤差です。 測定誤差 測定誤差は、測定時に発生する誤差で、 測定機器による誤差測定作業者による誤差外部条件による誤差偶然誤...
サンプリング

出版バイアスの意味

調査・分析をしたときに、思っていたこととは違う、否定的な結果が得られたときには、公表されにくいバイアスがあります。これを出版バイアスといいます。 調査・分析者にとってみたら、上手くいったことは公表したいと思い、失敗したことは公表しに...
サンプリング

母数の意味と、分母の違い

「母数」の意味を、「分母」の数のことだと思い込んでいたら、それは違うよという話です。 「好きな俳優は誰ですか?」と100人に街頭アンケートをとったとしましょう。そして、20人が「阿部寛!」と答えました。 このとき、全体に占める...
サンプリング

標本誤差と非標本誤差の違い

標本調査とは、母集団全体を調べるのではなく、標本を抜きとって調査をすることです。 母集団とは対象全体のことで、そのなかで調査対象とした一部分が標本、あるいはサンプルといいます。 たとえば、1000人の従業員が在籍する会社で10...
サンプリング

全数調査と標本調査の違い

調査は、その対象全体を調査するのか、それとも一部だけを調査するのかによって、全数調査と標本調査に分けることができます。 それぞれが、どのような調査なのか、どのようなメリット・デメリットがあるのかを説明します。 全数調査 ...
サンプリング

平均への回帰とはなにか。遺伝学者ゴルトンの発見

平均への回帰とは、データに偏りがあったとしても、いずれ平均値へと近くなる現象のことをいいます。 親の身長と、子供の身長の間にある関係について見てみましょう。19世紀末、遺伝学者のフランシス・ゴルトンは、親と成人した子供の身長について...
サンプリング

統計学のバイアス(偏り)の意味。認知バイアスとは違います

統計学では、「バイアス」という言葉を見聞きします。このバイアスについて、また心理学の認知バイアスという言葉との違いについて書きました。 バイアスとは 統計学で言うバイアスとは日本語でいえば「偏り」で、観測値から得た母集団の推定...
サンプリング

サンプルサイズとサンプル数の違い(標本の大きさと標本数)

「サンプルサイズ」と「サンプル数」という統計学用語。 この二つが間違って話されたり書かれたりすることがあります。このふたつの言葉は似ているし、なんだか、ややこしいものです。 これらの違いを説明するとこうです。 母集団から...
サンプリング

パラメータと母数、統計量の意味

「パラメータ」とは、母集団の特性値のことです。また「母数」ともいいます。 パラメータは一般に未知のものであり統計的推測をすることになります。重要であり代表的なパラメータとしては、母平均、母分散、母標準偏差などがあります。 「統...
サンプリング

標本(サンプル)の誤差を小さくする方法

母集団から抜き取った標本から、母集団の平均や比率を推定するときには、誤差が発生します。これを標本誤差といいます。 この記事では、標本の平均から推定した母集団の平均との誤差について、またその誤差の減らし方について考えてみましょう。 ...
サンプリング

有限母集団修正をもちいた標準誤差、標本平均の分散の計算

有限母集団修正とは、有限母集団から抜き取った標本があったとして、その標本平均の分散を計算するときに、$\frac{N-n}{N-1}$の係数をかけて修正をすることです。 この記事では、有限母集団修正をもちいた、標準誤差、標本平均の分...
サンプリング

標準誤差の意味と計算方法【標準偏差と標本平均の違いも解説】

「標準誤差」とは、標本平均の標準偏差のことです。 以下の式で計算します。 $$標準誤差=\frac{\sigma}{\sqrt{n}}$$ 母集団から標本データとして10個のデータを抜きとって、標本平均を計算します。これ...
サンプリング

復元抽出と非復元抽出

母集団から標本を抜き取ることを標本抽出(またはサンプリング)といいます。標本抽出には、復元抽出と非復元抽出があります。 「復元抽出」とは、なんどかの抽出をする際、抽出したものを1個ずつもとの集団に戻してから、次の抽出を行っていく方法...
サンプリング

中心極限定理の意味

「中心極限定理」とは、母集団がどのような分布であっても、標本の大きさn が大きければ、標本平均の確率分布は平均値\(μ\)、分散\(\frac{\sigma^2}{n}\)の正規分布で近似されるようになることです。 まず標準誤差につ...
サンプリング

有限母集団と無限母集団の意味とその違い

有限母集団 母集団(調査対象全体)のデータ数に限りがある場合、この母集団のことを有限母集団といいます。 有限母集団の場合はデータ数が有限なのですから、調べようと思えば全てのデータを調べることができます。母集団の特性値を正確に知...
サンプリング

視聴率はどのように計算されているのか。またその誤差について

視聴率とは、あるテレビ番組がどのくらいの世帯、人々から見られているかを示す数字です。 人気のあるテレビドラマ、スポーツの大会、大事件に関する特番など、国民の関心の高さを推し量ることができます。 新しいドラマが始まると、「初回視聴率○...
サンプリング

色々あるサンプリング方法の種類(ランダム、多段、層別、集落、系統)

調査をしたいと思う全体が母集団、そのなかで実際に調査をするために抜き取った一部を標本(またはサンプル)といいます。 母集団から標本を抜き取ることが、サンプリングです。 サンプリングをする際は、調査対象に適したサンプリング方法を...
サンプリング

インターネットでのアンケート調査のバイアスと信頼性

日ごろ私たちが目にするアンケート調査の結果は、インターネットの調査で行われているものがありますよね。 インターネット調査にはバイアスはないのでしょうか。また信頼できるものなのでしょうか。 インターネット調査にはバイアスが生まれ...
サンプリング

簡易的に比率の誤差を信頼係数95%で計算する方法

視聴率のような比率の 標本サイズnの比率pの標準誤差は、 $$\sqrt{(p×(1-p)/n)}$$ で計算することができます。 標本の比率は、母集団の比率からどのくらいの誤差が発生する可能性があるか。 信...
サンプリング

たくさん調査して標本のデータ数を増やすと誤差が減りにくくなっていく

母集団から抜き取った標本から得られた値は、母集団の特性値とはズレが生じます。 日本人の調査で、1億2000万人の母集団から、600人を選んで調査をしたら、真の値である1億2000万人の調査結果と、実際に調査した標本の600人の調査結...
サンプリング

大数の法則をコイン投げの例でシミュレーションして、わかりやすく考えてみる

大数の法則がどのような法則なのか、日常のできごとやコイン投げを例として解説していきます。 大数の法則とは 大数の法則とは、試行の回数を増やしていくほど、結果は本来の確率に限りなく近づいていくことです。 コインを投げて表が...
サンプリング

母集団と標本(サンプル)とその違い。また標本抽出・サンプリングの意味

統計学を学ぶうえでは、母集団と標本は重要な考えです。母集団と標本の意味、標本から母集団を推定することについて書きました。 母集団と標本の意味 調査をして知りたいと思っている集団全体のことを母集団といいます。 母集団を調査...
タイトルとURLをコピーしました