当サイトの説明

このサイトでは、統計学の基礎知識について紹介しています。

私が統計学に出会ったのは、社会人になってからです。まったく統計学を知らないところから学びをスタートしたので、当初は統計学の理論を本で読んでも、なんのこっちゃわかりませんでした。

学び続けるなかで、自分が「わかった!」と理解できたことを書き残し、サイトにまとめています。ゆっくりと山を登るように一緒に学んでいきましょう。

統計学の本を開くと、平均やばらつき、確率、分布、推定、検定、回帰分析といった流れで、説明がなされています。

当サイトでも、それと同じようにカテゴリー分けをして、網羅的に解説ページを作成しています。

記事一覧のページもあります。
サイトマップ

統計学のことはじめ

統計学とは、データ分析の科学です。データを取り扱うわけですので、まずはデータとはなにかといったことや、データの種類について解説した記事を書いています。

データと情報の違い

データの種類。尺度(名義・順序・間隔・比率尺度)と質的・量的での分類

確率と統計の違い

データをひとことであらわす

対象のことを知るためにデータをたくさん集めました。そのたくさんのデータを、そのままの見ているだけでは、対象がどのような特性を持っているのか、つかむことができません。

データを要約し特性値を見ることで、データがどのようなものなのか理解することができます。

代表値とは?平均値、中央値、最頻値の違いと使い分けを紹介

平均値の種類はひとつだけじゃない。算術平均、加重平均、幾何平均、移動平均の違いと使い分け

幾何平均(相乗平均)の意味と計算方法~伸び率の平均を求める~

加重平均の意味と計算方法

移動平均の意味や目的、求め方、注意点

データのばらつき

各データがどのくらい大きかったり、小さかったりするのか、ばらつきは、分散や標準偏差であらわされます。

平均とばらつき、この2つによって、データの分布がどのようなものなのか知ることができます。また、複数のデータ分布があったときに、平均・ばらつきを示す数値によって、比較をすることができます。

数ある分析でも、この主に2つの数値をつかった演算によるものが多いです。つまり、この2つが統計学の基礎の基礎になります。

標準偏差・分散の意味と計算方法

偏差平方和と分散、偏差積和と共分散の計算式と関係性

データの分布

分布とは、ある事象が大小さまざまな大きさで発生することで、それに決まった確率規則があるものが確率分布です。

統計学では、あるものごとが発生するのは、確率的な規則があると考えます。なんらかの確率分布があって、そこから発生したデータが、私たちが観測するものと考えます。

こうすることで、データの発生を確率的に考えることができ、予測につかうことができるようになります。

世の中には確率分布に当てはまる事象が多くあります。

統計学でいう分布の意味

離散型の確率分布、連続型の確率分布。それぞれの種類と違い

正規分布の形など特徴や性質、確率密度関数の式と表す記号について説明します

ベルヌーイ試行と二項分布の違いと関係性

確率のはなし

数学的な確率論を学んでいきます。まだ統計学の中心部でないですが、きちんと理解して積み上げていかないと、後にでてくることが理解できなくなります。

確率の概念は、標本空間をつかって考えることができます。

標本空間の基本(記号、標本点、和事象・積事象・余事象、ベン図の意味)

確率の意味や定義、記号での表し方などの基礎基本

確率の積とは

確率の基本的な公理

順列の意味、記号と計算方法

組み合わせの基本と計算方法(順列との違いを説明)

また期待値といった考え方も重要です。宝くじで期待値について考えることができます。

期待値の意味と計算方法をコインやサイコロ、ギャンブルゲームで考えてみる

宝くじはどのくらいの確率で当たるのか?当選確率の計算方法を紹介します

サンプリング

調査対象全体のことを母集団といい、サンプリングとは、母集団から一部分を抜き取ることです。

社会調査においては、すべてのデータを集めることは非常に難しいですから、サンプリングによって行われることが多いです。

母集団と標本(サンプル)とその違い。また標本抽出・サンプリングの意味

色々あるサンプリング方法の種類(ランダム、多段、層別、集落、系統)

推定

標本のデータから、母集団の特性を推しはかることを、推定といいます。

母集団の平均値を推定する場合は点推定、平均値の範囲を推定する場合は区間推定といいいます。

点推定と区間推定の意味と違い

検定

検定とは、発生したことが意味があって起こるべくして起こったのか、それとも偶然に起こったのかを判定する行為です。

検定の考え方、やり方についてまた、検定のときにつかう言葉についてを合わせて説明します。

検定とは何をするのか。意味、やり方、有意差、棄却、帰無仮説などを説明

基本的な検定の種類と使い分け方法をまとめてみた

基準化の意味と基準化変量の求め方(標準化ともいう)

違うのかどうかを判断する検定では、ほんとうは同じなのに違うと判断してしまう誤りと、本当は違うのに同じであると判断してしまう誤りがあります。

あわて者の誤り・ぼんやり者の誤り(第一種の誤り・第二種の誤り)

相関分析・回帰分析

統計学の入門本では、データの分布や確率、推定、検定をひととり学んだら、最後に回帰分析で終わる、といった構成が多いです。

相関関係の意味と相関係数の計算方法

相関分析と回帰分析の違い

相関関係を見るときに注意点を解説する記事も書いています。

相関関係があるのにない。ないのにある。

相関関係と因果関係の違い。第3因子に注意しよう

品質管理

品質管理の分野では、統計学を用いて分析が行われますし、考え方も統計学をもとにしたものがあります。

生産者のリスクと消費者のリスク

重点指向とは

品質管理には、QC七つ道具と呼ばれる分析手法があります。基本は、製造分野でつかわれる手法ですが、他の分野、たとえばサービスの分野であっても活用することが可能です。

パレート図(QC7つ道具)の作り方と見方・使い方

散布図(QC7つ道具)の書き方と見方。正の相関・負の相関はどのように打点されるか

統計学話

統計学に関連した読み物も書いています。

宝くじがよく当たる売り場では、なぜ当たりくじが出るのか

統計学をつかった予測は外れることがあるのか

統計学でパン屋の不正を見破ったポアンカレの話

統計学で分析をすれば原因のメカニズムがわからなくても問題解決ができる

記事一覧のページもあります。
サイトマップ

ご訪問いただき、とうもありがとうございます。