正規分布の基本

シェアする

正規分布の形

正規分布は、中央が一番頻度が大きく、左右対称で滑らかで美しい形をしています。平均値=中央値=最頻値となっており、中心から離れるに従って、下の線に近づいていく、釣鐘や富士山の形にカーブした分布です。

ヒト(成人)やそのほか動物の身長、学校のテストの成績、製品のサイズなどなど、多くの自然現象や社会現象は、正規分布に近い形をとります。正規分布に近似するといい、近似しているのであれば、実用上、正規分布として取り扱うことができます。

seikibunpu.tokuseiti2

世の中には正規分布するものごとが多い

なにか製品をつくるときのことを考えてみましょう。たとえば割りばし。ある割りばしの長さを測ってみると21cmでした。製品は設計段階において規格値が定められます。割りばしであれば、長さ21cmの割りばしをつくろうと決めて、それができるように製造機械の設定・調整をするはずです。

でも、すべての割りばしがピシャリと21cmになるわけではありません。21.1cmやら20.9㎜の割りばしもつくりだされます。一見21.0cmとみられた割りばしであっても、もっと精密に計測できる機器を用いれば、21.01cmのようなサイズなっているわけです。出来上がる製品サイズは、ねらったサイズから多少誤差が生まれてしまうのですが、見た目にはわかりませんし、実用上まったく問題ありませんので、そのまま製品化されます。

誤差が生じてしまうとはいっても、目標としている規定のサイズ、つくろうとねらっているサイズがあるわけですから、当然その規定サイズの製品が一番多くつくられます。少しだけサイズがズレた製品も多くつくられてしまうでしょう。ねらいのサイズからとんでもなく大きいサイズや大きすぎるものや小さすぎるものは、よほどの失敗をしないと作られませんから、少ないはずです。

このように、目標の規格値どおりの製品をつくりだそうとすると、目標値が平均値となり、目標値付近の製品がたくさん作られ、目標値から離れるほど少なくなるので、上記したグラフのような分布をするはずです。ものづくりの製品サイズや重量の値などは正規分布に近似します。

そのため正規分布は誤差曲線とも呼ばれます。

学校のテストの成績はどうでしょうか。

ずば抜けて成績の良い学生、逆に全く勉強しないとても成績の悪い学生は、双方とも少数派です。多くが平均点付近の点数を取り、ずば抜けて良い成績に近づくほど、その成績をとれる学生の数は減少していきます。こちらも、平均値を中心にして裾にいくほど学生数が少なくなるような分布をし、正規分布に近い分布となります。

ものづくりの製品、テストの成績、人の身長、動植物の体長などなど、世の中には正規分布があふれています。

正規分布は、平均値と標準偏差で決まる

正規分布は、平均値と標準偏差でどのような分布になるのかが決まります。言いかえると分布グラフの中央の値の大きさと、山の広がり具合です。平均値がμ、標準偏差がσである正規分布は、略記として

N(μ,σ2

と表記されます。NはNormal distribution(正規分布)の頭文字です。μは平均値、σ2は分散で、 この2つの値だけで表記されることになります。標準偏差の値が小さければ、急峻な岩山のような形になり、標準偏差の値が大きければバラつきが大きくなるので、裾が広がったのっぺりとした丘のような形になります。

平均値は同じで、標準偏差を変化させた分布

標準偏差が大きくなると、分布のてっぺんの位置は同じままで、山がのっぺりと広がります。
緑色: N(50,52

オレンジ色: N(50,152

seikibunpu.henka1

標準偏は同じままで平均値を変化させた分布

標準偏差は変わらないので山の形はそのままで、平均値が大きくなると右へスライド、平均値が小さくなると左へスライドします。

緑色: N(50,52
オレンジ色: N(70,52

seikibunpu.henka2