このサイトでは、統計学の基礎知識について紹介しています。
私が統計学に出会ったのは、社会人になってからです。まったく統計学を知らないところから学びをスタートしたので、当初は統計学の理論を本で読んでも、なんのこっちゃわかりませんでした。
学び続けるなかで、自分が「わかった!」と理解できたことを書き残し、サイトにまとめています。ゆっくりと山を登るように一緒に学んでいきましょう。
統計学の本を開くと、平均やばらつき、確率、分布、推定、検定、回帰分析といった流れで、説明がなされています。
当サイトでも、それと同じようにカテゴリー分けをして、網羅的に解説ページを作成しています。
サイトマップ
統計学のことはじめ
統計学とは、データ分析の科学です。データを取り扱うわけですので、まずはデータとはなにかといったことや、データの種類について解説した記事を書いています。
・データの種類。尺度(名義・順序・間隔・比率尺度)と質的・量的での分類
データをひとことであらわす
対象のことを知るためにデータをたくさん集めました。そのたくさんのデータを、そのままの見ているだけでは、対象がどのような特性を持っているのか、つかむことができません。
データを要約し特性値を見ることで、データがどのようなものなのか理解することができます。
・平均値の種類はひとつだけじゃない。算術平均、加重平均、幾何平均、移動平均の違いと使い分け
・幾何平均(相乗平均)の意味と計算方法~伸び率の平均を求める~
データのばらつき
各データがどのくらい大きかったり、小さかったりするのか、ばらつきは、分散や標準偏差であらわされます。
平均とばらつき、この2つによって、データの分布がどのようなものなのか知ることができます。また、複数のデータ分布があったときに、平均・ばらつきを示す数値によって、比較をすることができます。
数ある分析でも、この主に2つの数値をつかった演算によるものが多いです。つまり、この2つが統計学の基礎の基礎になります。
データの分布
分布とは、ある事象が大小さまざまな大きさで発生することで、それに決まった確率規則があるものが確率分布です。
統計学では、あるものごとが発生するのは、確率的な規則があると考えます。なんらかの確率分布があって、そこから発生したデータが、私たちが観測するものと考えます。
こうすることで、データの発生を確率的に考えることができ、予測につかうことができるようになります。
世の中には確率分布に当てはまる事象が多くあります。
・正規分布の形など特徴や性質、確率密度関数の式と表す記号について説明します
確率のはなし
数学的な確率論を学んでいきます。まだ統計学の中心部でないですが、きちんと理解して積み上げていかないと、後にでてくることが理解できなくなります。
確率の概念は、標本空間をつかって考えることができます。
・標本空間の基本(記号、標本点、和事象・積事象・余事象、ベン図の意味)
また期待値といった考え方も重要です。宝くじで期待値について考えることができます。
・期待値の意味と計算方法をコインやサイコロ、ギャンブルゲームで考えてみる
・宝くじはどのくらいの確率で当たるのか?当選確率の計算方法を紹介します
サンプリング
調査対象全体のことを母集団といい、サンプリングとは、母集団から一部分を抜き取ることです。
社会調査においては、すべてのデータを集めることは非常に難しいですから、サンプリングによって行われることが多いです。
・母集団と標本(サンプル)とその違い。また標本抽出・サンプリングの意味
・色々あるサンプリング方法の種類(ランダム、多段、層別、集落、系統)
推定
標本のデータから、母集団の特性を推しはかることを、推定といいます。
母集団の平均値を推定する場合は点推定、平均値の範囲を推定する場合は区間推定といいいます。
検定
検定とは、発生したことが意味があって起こるべくして起こったのか、それとも偶然に起こったのかを判定する行為です。
検定の考え方、やり方についてまた、検定のときにつかう言葉についてを合わせて説明します。
・検定とは何をするのか。意味、やり方、有意差、棄却、帰無仮説などを説明
違うのかどうかを判断する検定では、ほんとうは同じなのに違うと判断してしまう誤りと、本当は違うのに同じであると判断してしまう誤りがあります。
・あわて者の誤り・ぼんやり者の誤り(第一種の誤り・第二種の誤り)
相関分析・回帰分析
統計学の入門本では、データの分布や確率、推定、検定をひととり学んだら、最後に回帰分析で終わる、といった構成が多いです。
相関関係を見るときに注意点を解説する記事も書いています。
品質管理
品質管理の分野では、統計学を用いて分析が行われますし、考え方も統計学をもとにしたものがあります。
品質管理には、QC七つ道具と呼ばれる分析手法があります。基本は、製造分野でつかわれる手法ですが、他の分野、たとえばサービスの分野であっても活用することが可能です。
・散布図(QC7つ道具)の書き方と見方。正の相関・負の相関はどのように打点されるか
統計学話
統計学に関連した読み物も書いています。
・統計学で分析をすれば原因のメカニズムがわからなくても問題解決ができる
サイトマップ
ご訪問いただき、とうもありがとうございます。