統計学で見る大文字の「X」と小文字の「x」の違い

  • 大文字の「\(X\)」は確率変数のこと
  • 小文字の「\(x\)」は観測値のこと

を示しています。

大文字の「\(X\)」は確率変数のこと

確率変数とは、その値をとる確率が与えられている変数です。

あるいは、確率分布に従って起こる変数が確率変数、です。

たとえば、1から6の面があるサイコロであれば、サイコロを振って1の面が出るのも、2の面が出るのも、そのほかの面が出るのも、それぞれ1/6の確率で決まっていますよね。

このようにできごとに対して、確率が与えられている変数が確率変数であり、大文字の「\(X\)」で表されます。サイコロを振って出てくる目には数1~6 の値があります。

この確率変数の平均値は期待値といって、\(E(X)\)で表されます。

また、二つの確率変数があるときには、\(X\)に加えて、\(Y\)がつかわれます。

小文字の「\(x\)」はの観測値のこと

実際に実現したデータは小文字の「\(x\)」で表されます。

実現したデータ\(x\) は、確率変数が一定の確率でその値\(x\) を実現させた結果であると考えます。

バックに確率変数なるものが控えていて、そこから実現値\(x\) が出ててきたという感じです。

自然科学では実験、社会科学では調査を行ってデータを集めます。そこで実際に得られたデータのことを観測値と呼び、小文字の\(x\) で表記されます。

サイコロを投げて各目の1~6 の数値を得るときの話です。2個のサイコロを投げて出た目の数の平均は、

$$\frac{(x_1 +x_2)}{2}$$

と、このように表されます。この値は、実際に出た目の数で変わってくる値です。

大文字の「\(X\)」と 小文字の「\(x\)」はこのように使い分けられています。