独立とは、複数の事象があったときに、片方の事象が変化しても、もう片方の事象には影響を及ぼさないことです。
事象Aと事象Bがあったときに、事象Bが事象Aの結果に影響を与えていないときには、 「事象Aは独立である」といった言い方をします。
例えば、ここにAというサイコロとBというサイコロがあり、ポイっと投げてみます。
Aのサイコロは6 の目が出ました。Bのサイコロは3 の目が出ました。このときにBのサイコロはAのサイコロになにか影響を与えたでしょうか。Aのサイコロ投げの結果、6 の目が出たのは、Bのサイコロ投げのせいでも、おかげでもありませんよね。
Aのサイコロは独立しているといえます。
また、Aのサイコロ投げとBのサイコロ投げは、お互いになんら影響を与えていないので、両者は独立であるともいえます。
独立の概念を知っておく
確率において「独立」というのは重要な概念で、さまざまなところで顔を出してきます。
確率の積
確率の計算においては、独立を前提として成り立つ式があります。上記のように事象Aと事象Bが独立であるとき、それらがともに起こる確率は、掛け算で計算することができます。
Aのサイコロ投げとBのサイコロ投げは独立であるので、両方とも6 の目が出る確率は、それぞれの6 の目が出る確率を掛け合わせれば計算できます。
Aのサイコロで6 の目が出る確率は、1/6です。
Bのサイコロで6 の目が出る確率は、1/6です。
1/6 × 1/6 = 1/36
1/36の確率でAとBの2つのサイコロで6の目が出ます。ここでは、
P(A∩B)= P(A)× P(B)
の式が成り立ちます。(A∩B)は、AかつB、という意味です。
ただし、片方のサイコロの結果が、もう片方のサイコロの結果に影響を与えるような仕組みがある場合は、これは成り立ちません。ひとつ目のサイコロで偶数が出ると、ふたつ目のサイコロには、偶数が出るような特殊な細工がしくまれているような場合です。
こちらを参考にしてください。
参考記事 確率の積とは
分散の加法性
平均値と分散を持つ2つの分布があったときに、それぞれの分布から取り出して合わせたものの分散は、それぞれの分散の数値のそのまま足し合わせた値になります。
これを分散の加法性というのですが、その2つ分布から取り出されたものはそれぞれ独立した確率変数であることが分散の加法性の条件になっています。
2つの確率変数XとYがあって、XとYが独立であるときには、XとYを合わせたものの分散は、X+Yとなるのです。また、XからYを引いたものの分散も同じくX+Yとなります。
V(X±Y) = V(X) + V(Y)
詳しくはこちらの記事に書いています。
参考記事 分散の加法性
独立性の検定
独立性の検定とは、クロス集計表に関して用いる検定です。クロス集計表とは、2つの質的データの関係を見るときに用いる表で、分割表とも言われます。
たとえば、 とある大学の学部ごと男女別の学生数をまとめてみると、このようなクロス集計表ができました。
男性 | 女性 | |
---|---|---|
経済学部 | 215 | 184 |
工学部 | 302 | 89 |
農学部 | 178 | 229 |
性別と学部の学生数は独立であるかどうかを検定します。
- 帰無仮説H0を「学生の性別と選ぶ学部は独立している」
- 対立仮説H1を「学生の性別と選ぶ学部は独立ではない」
とします。
この検定で有意差がなければ、この学校では学生の性別と選ぶ学部は独立していて関係がないと判断できます。
クロス集計表のような学部の学生数と性別の偏りは、偶然生まれたものであるというを意味します。
有意差が見られれば、この学校の学生が選ぶ学部と性別は独立ではない、つまり関係があると判断できます。性別によって人気のある学部・人気のない学部に違いがあるということです。
大数の法則
コインを連続で投げて、表が出るか裏が出るかを集計していくときのことを考えてみましょう。表が出る確率は1/2、裏が出る確率は1/2です。
最初のうちは、表ばかりが出て、その割合は1/2を越えているといったことがあるでしょう。最初に表が5回連続で出たら、その時点では表が出る確率100%です。その逆もしかりで、裏ばかり出ることも。
しかし、コイン投げの回数を重ねていくうちに、表の出た割合は、1/2に収束していきます。これを大数の法則といいます。
表が連続で5回続いたら、次はきっと裏が出るだろうと思ってしまう人が多いでしょう。これをギャンブラーの誤謬といいます。しかし、そんなことはなく、次のコイン投げも表・裏が出る確率はそれぞれ1/2ずつで、同じです。
参考記事 ギャンブラーの誤謬
今回のコイン投げは、次のコイン投げにまったく影響を与えません。それぞれのコイン投げは独立しています。
大数の法則をコイン投げの例でシミュレーションして考えてみるの記事では、そのことについて説明しています。
独立の概念を把握しておく
複数の事象について考えるとき、お互いがお互いの結果に影響を与えていない独立であることを前提にして、成り立つ数式が多いです。
統計学を学んでいくうえで、「独立」はさまざまなところで出てきますので、その概念について把握しておきましょう。
独立に関する記事
参考記事 分散の加法性
参考記事 確率の積とは