「サンプルサイズ」と「サンプル数」という統計学用語。
この二つが間違って話されたり書かれたりすることがあります。このふたつの言葉は似ているし、なんだか、ややこしいものです。
これらの違いを説明するとこうです。
母集団から無作為にサンプルをとりだしたとき、サンプルの観測データの個数が「サンプルサイズ」、サンプルの群の数が「サンプル数」となります。
よく出てくる記号「n」はサンプルサイズのことです。
英語だと違いがわかりやすい気がします。
- samplesize サンプルサイズ(標本の大きさ)
- the number of samples サンプル数(標本数)
サンプルをひとつのかたまりとみれば、観測データの数が増えると、サイズが大きくなるのだから、サンプルサイズは、データの数によるものだとわかります。
また、サンプル数とは、ひとつのかたまりであるサンプルが何群あるか(あるいは何組、何セット)といったことであって、何回サンプリング(標本抽出)したか、という話です。
たとえば、あるメーカーにて、
- 1日目には100個の製品のデータを測定した
- 2日目には150個の製品のデータを測定した
- 3日目には200個の製品のデータを測定した
とします。
この場合、
- サンプルサイズは、100、150、200
- サンプル数は、3
となります。1日目の100個の製品を測定したときには、そのうちの1つ1つのデータは、標本とは言いません。標本とは、測定した100個ワンセットのことです。だから、標本数というと、そのセットが何個あるのか?という話になるのです。