データの種類。尺度での分類と、質的と量的での分類

シェアする

世の中にあふれるデータにはさまざまな顔があります。ナンバーであったり、人の名前であったり、%であったり、個数であったります。どんな種類のデータなのかによって分析方法が変わってきます。ですので、あらかじめデータの種類を知っておき、データを分析するときには、自分が手に入れたデータがどの種類のデータなのかを把握することが必要です。

この記事では、尺度で分類する方法、質と量で分類する方法で、データの種類について説明します。

尺度で分類する

尺度とはもの事を評価したり、判断したりする時のものさし、基準のことです。その尺度で、データを次の4つに分類することができます。

  1. 名義尺度
  2. 順位尺度
  3. 間隔尺度
  4. 比尺度

尺度水準は低い・高いという言い方をします。低い水準から、名義尺度⇒順位尺度⇒間隔尺度⇒比尺度の順で並んでいます。名義尺度が一番低い水準、比尺度が一番高い水準となり、高い水準はそれより低い水準の性質を含むような形になっています。

1.名義尺度

名義尺度は、単に名称として使われているだけで、間隔や順位にも意味がないものです。

名称そのものを使用したり、分類するために整理番号を割り当てたものです。ユニフォーム背番号、電話番号、会員番号、都道府県につけた番号などがあります。これらの数字には順位などの意味は無く、個別のデータを区別するためにつけている数字です。

例えばスポーツをする時、ユニフォームの背番号で10番が○○のプレーをした、7番が○○ファウルをした、と番号で選手を判断しますが、データとして見るとその番号自体には何も意味がないですよね。このような目盛りを名義尺度といいます。

2.順位尺度

順位尺度は、数値の間隔には意味がなく数字の順位や順番のみが意味を持つ目盛りです。

文字通り順位や順番を割り当てたものです。1、2、3・・・と順番が付けられ、その順番は意味をもちます。高校のクラス内でのテスト試験の順位、クラス40人中で体育の授業で行われた持久走大会での順位、あるアイドルグループの中での人気順など、1番目、2番目、3番目と順番がつけられます。より上位のものに意味のある数字が与えられます。それは小さな数字になるときもあれば、逆に大きな数字になることもあります。

順番には意味が生まれますが、その各順位間の間隔には何も意味がありません。高校のクラス内でテスト結果で競争をしているとしたら、着目するのは順位ですよね。1位なのか、2位なのか、3位なのかが問題なのであって、テストの得点は大差でも僅差でも、その差は関係が無いわけです。

3.間隔尺度

間隔尺度は、数値の間隔に意味がある尺度です。 順位だけでなく、その間隔も定量化したものです。ただし間隔は定量化されているのですが、その比率には意味がないものです。

例えば、温度「10℃」と「20℃」の違いは、10の間隔があるというだけで、「20℃」は「10℃」の2倍熱いというこでは無いですね。また「0℃」は数字は0ですが、温度が何もないということではないです。このように数字の間隔に意味がありますが、数字の比率には意味がないものが間隔尺度です。

4.比尺度

比尺度は、間隔が定量化され、原点が設定され、比率にも意味があるものです。

例えば、お金は0円は何もない状態であり、1円刻みで増えていくと、100円は10円の10倍、1000円は10円の100倍となり、比率にも意味が出てきます。比率尺度ともいいます。

質か量かで分類する

データの性質から、質的データと量的データに分けることができます。

1.質的データ

数字ではかることがでないデータ、足し算、引き算、掛け算、割り算の四則演算ができないデータです。定性データ、カテゴリーデータともいいます。「購入した商品の気にいったところ」など数字で表すことのできないデータです。

アンケートで、

  1. 「たいへん満足した」
  2. 「やや満足した」
  3. 「どちらでもない」
  4. 「あまり満足しなかった」
  5. 「満足しなかった」

5段階評価でアンケートをとったとします。

これら1~2と2~3などの間隔は等しいとはいえないですから、基本的には数字で推し量ることのできるものではありません(無理やり間隔を等しいことにしてしまうのもいいですが)。

2.量的データ

数字ではかることができるデータです。定量データともいいます。

まとめ

「定性、定量」と、尺度で分類したデータの種類である「名義尺度、順位尺度、間隔尺度、比尺度」と合わせて考えると、

定性データは、

  • 名義尺度
  • 順位尺度

定量データは、

  • 間隔尺度
  • 比尺度

と分類することができます。

統計分析をするにあたって、データがどのような種類なのかによって、分析手法が変わってきます。これらの尺度のこと踏まえて分析手法を選んだり考えたりする必要があるので、尺度によるデータの種類ついて把握しておくことは大事です。