サンプルサイズとサンプル数の違い(標本の大きさと標本数)




「サンプルサイズ」と「サンプル数」という統計学用語。

この二つが間違って話されたり書かれたりすることがあります。このふたつの言葉は似ているし、なんだか、ややこしいものです。

これらの違いを説明するとこうです。

母集団から無作為にサンプルをとりだしたとき、サンプルの観測データの個数が「サンプルサイズ」、サンプルの群の数が「サンプル数」となります。

よく出てくる記号「n」はサンプルサイズのことです。

英語だと違いがわかりやすい気がします。

  • samplesize サンプルサイズ(標本の大きさ)
  • the number of samples サンプル数(標本数)

サンプルをひとつのかたまりとみれば、観測データの数が増えると、サイズが大きくなるのだから、サンプルサイズは、データの数によるものだとわかります。

また、サンプル数とは、ひとつのかたまりであるサンプルが何群あるか(あるいは何組、何セット)といったことであって、何回サンプリング(標本抽出)したか、という話です。

たとえば、あるメーカーにて、

  • 1日目には100個の製品のデータを測定した
  • 2日目には150個の製品のデータを測定した
  • 3日目には200個の製品のデータを測定した

とします。

この場合、

  • サンプルサイズは、100、150、200
  • サンプル数は、3

となります。1日目の100個の製品を測定したときには、そのうちの1つ1つのデータは、標本とは言いません。標本とは、測定した100個ワンセットのことです。だから、標本数というと、そのセットが何個あるのか?という話になるのです。