データの種類

シェアする

データはさまざまな顔をしています。ナンバーであったり、人の名前であったり、%であったり、個数であったります。データを分析するときには、どんな種類のデータなのかによって分析方法が変わってきますので、データの種類を知り、自分が手に入れたデータがどの種類のデータなのかをとらえることが必要です。

この記事では、尺度で分類する方法、質と量で分類する方法で、データの種類について知っていただければと思います。

尺度で分類する

尺度とはもの事を評価したり、判断したりする時のものさし、基準のことです。その尺度で、データを次の4つに分類することができます。

1.名義尺度

2.順位尺度

3.間隔尺度

4.比尺度

低い水準から、名義尺度⇒順位尺度⇒間隔尺度⇒比尺度⇒と順番に並んでいます。名義尺度が一番低い水準、比尺度が一番高い水準となり、より高い水準は低い水準の性質を含むような形になっています。

1.名義尺度

単に名称として使われているだけで、間隔や順位にも意味がないものです。

名称そのものを使用したり、分類するために整理番号を割り当てたものです。ユニフォーム背番号、電話番号、会員№、都道府県につけた番号などがあります。これらの数字には順位などの意味は無く、個別のデータを区別するためにつけている数字です。

例えばスポーツをする時、ユニフォームの背番号で10番が○○した、7番が○○した、と番号で選手を判断しますが、データとして見るとその番号自体には何も意味がないですよね。このような目盛りを名義尺度といいます。

2.順位尺度

数値の間隔には意味がなく数字の順位や順番のみが意味を持つ目盛りです。

文字通り順位や順番を割り当てたものです。1、2、3・・・と順番が付けられ、その順番は意味をもちます。高校のクラス内でのテスト試験の順位、クラス40人中で体育の授業で行われた持久走大会での順位、あるアイドルグループの中での好きな人の順番など、より上位のものに小さな数字か逆の大きな数字が与えられ、1番目、2番目、3番目と順番がつけられます。

順番には意味が生まれますが、その各順位間の間隔には何も意味がありません。テストの試験で順位に着目すると、実際の記録は大きな差があっても無くても、1位なのか、2位なのか、3位なのかが問題なのであって、その差は関係が無いわけです。

3.間隔尺度

数値の間隔に意味がある尺度です。 順位だけでなく、その間隔も定量化したものです。間隔は定量化されているのですが、その比率には意味がないものです。

例えば、温度『10℃』と『20℃』の違いは、10の間隔があるというだけで、『20℃』は『10℃』の2倍暑いというこでは無いですね。また『0℃』は数字は0ですが、温度が何もないということではないです。数字の間隔に意味がありますが、数字の比率には意味がないのです。

4.比尺度

間隔が定量化され、原点が設定され、比率にも意味があるものです。

例えば、お金は0円は何もない状態であり、1円刻みで増えていくと、100円は10円の10倍、1000円は10円の100倍となり、比率にも意味が出てきます。比率尺度ともします。

質か量かで分類する

データの性質から、質的データと量的データに分けることができます。

1.質的データ

数字ではかることがでないデータ、足し算、引き算、掛け算、割り算の四則演算ができないデータです。定性データ、カテゴリーデータともいいます。「購入した商品の気にいったところ」など数字で表すことのできないデータです。

アンケートで

1.「たいへん満足した」

2.「やや満足した」

3.「どちらでもない」

4.「あまり満足しなかった」

5.「あまり満足しなかった」

5段階評価でデータをとったとします。

これら1~2と2~3などの間隔は等しいとはいえないですから、数字で推し量ることのできるものではありません。

2.量的データ

数字ではかることができるデータです。定量データともいいます。

まとめ

「定性、定量」と、尺度で分類したデータの種類である「名義尺度、順位尺度、間隔尺度、比尺度」と合わせて考えると

定性データ

– 名義尺度

– 順位尺度

定量データ

– 間隔尺度

– 比尺度

と分類することができます。

統計分析をするにあたって、データがどのようなデータなのかによって、分析手法が変わってきます。これらの尺度のこと踏まえて分析手法を選んだり考えたりする必要があるので、尺度によるデータの種類ついて把握しておくことは大事です。