統計学で分析をすれば原因のメカニズムがわからなくても問題解決ができる

仕事をしていれば、様々な問題にぶつかります。

その問題を解決しなければならないが、原因の詳細がいまいちわからない。だから問題解決できない。ふつう、原因をきちんと解明しないと問題解決はできないものと考えられてます。

しかし、統計学の分析を活用すれば、原因の詳細、そのメカニズムがわからなくても、解決するための答えを速く出して、問題解決をしていくことが可能になります。むしろ、先にデータ分析によって原因が特定され、そのあとに原因のメカニズムが解明されることもあります。

これはどんな分野にでも当てはまることです。特定の分野で問題を解決するには、その分野の知識はある程度は必要になりますが、そこまで精通しなくてもデータ分析によって問題解決の道筋を見つけることができます。その分野のことで難しくてわからないことがあったとしても、精通した人とチームを組み、強力しながら問題解決にあたればなんとかなりそうです。

QCでは統計学を活用する

メーカーの製造工場で、データ分析によって問題解決をする役割を果たすのは品質管理です。

品質管理は、QC(quality control)と呼ばれることも多いです。私はもともとこの仕事をしていまして、仕事である品質管理に関する本を読んで勉強するなかで統計学と出会ったのでした。品質管理の本を紐解けば、統計学が顔をあらわすのです。

品質を管理するためには、統計学的な手法を用います。代表的な手法・ツールとして、QC7つ道具なるものがあり、それには、ヒストグラム、チェックシート、特性要因図、管理図、散布図、パレート図、層別があります。

チェックシートと特性要因図は、統計学的手法を活用したものだとは言えなさそうですが、ヒストグラムも含めてデータあるいは情報を視覚的に表す手法ですし、管理図は工程の管理状況を確認するため図であり、標準偏差やレンジなどが活用されます。

散布図は、2変数の関係性を示す図で相関関係、相関係数に関わるものです。

パレート図は、項目ごとに数値の大きい順に棒グラフにし、累積%の折れ線グラフを組み合わせた図です。

層別は、ばらつきを調べるための考え方です。これが原因ではないかと思う要因ごとに集計をし、それぞれのデータの平均値やバラつき、変化などを比較します。

QC7つ道具以外にも、品質管理の本には仮説検定のことや実験計画法のことが書かれていますし、メーカーでの製品検査において抜取検査なるものがありますが、これにも確率論および統計学的方法が利用されています。品質管理には統計学的な考え方が見られますね。

品質管理の考え方、手法の部分には、統計学が活用されています。

QCからの発想

ここで、品質管理(QC)のノウハウについて書かれた唐津一氏の著作「QCからの発想」を紹介をしたいと思います。1987年に出版された古い本なのですが、データの分析に関して非常に勉強になりました。手法に関してではなくて考え方に関することで、です。

この本のなかで一番印象に残ったのは、「実験をし、データ分析をすれば、原因のメカニズムがわからなくても問題解決ができる」という内容です。

少し長くなりますが引用をします。

不良が出る理由がわかっても、不良が減るとは限らない。不良が減るには何か有効な対策をたてて、それを実行して初めて減るのである。たとえば、病気の原因がわかったとしても、これを適切に治療できるかどうかわからないと同じである。

しかし、品質管理屋としては、不良の出るメカニズムが判ろうと判るまいと、とにかく減らさなくては、落第である。

そんなことができるかと思うだろうが、それが可能なのである。そのひとつの方法が実験である。 実験というのは、なぜそうなるかという理由がわからなくても、どうすればよいかを確かめることができる。たとえば、メッキ液の温度をいろいろかえて、これが一番よい温度、というのは実験で見つけ出すことは可能である。

この場合、その温度にすればなぜ不良が減り、よいメッキができるのかの理由は判らないかもしれないし、また判らなくてもよい。どにかくその温度にすればうまく仕上がるということが判れば、その現場はうまく動くのである。

だから、品質管理屋にとっては、どうしても実験のエキスパートになることが必要条件だといえる。

ここでは、データを集めて、データ分析主導でこれが原因なのでは?と突き止めて、後から原因が判明することもあります。

製造工場で統計学が活きる

私もメーカーの製造工場において、上記したことを感じた経験があります。製品の不良を削減したときの話です。

新製品を製造開始し始めたばかりのときは、初期流動期間と呼ばれ、さまざまな問題が発生しやすい期間です。それは、設計段階、テスト製造段階では、発見できなかったものが、実際に量産が開始されてから、あらわれてくるのですね。

設計段階でのテスト製造ではつくる量は多くありません。実際に製造段階になったときのほうが大量に、長い時間、製品がつくられますから、どうしても設計段階で見つけられなかった不良品が出てきやすいのです。設計がしっかりできていないほどそうなります。とはいえ、ふつうは製造しているうちにいろいろと手が打たれて、不良率は減っていきます。

しかし、あるとき、なかなか原因をつかめず、不良がなくならないことがありました。

データ分析でなにかできないかと考えて、製造現場でデータを集めて分析をしました。不良品がはめちゃくちゃ多くなるときもあれば、いつもより少なくなるときもありました。そのようにばらつきがあるということは、ばらつきは発生させているなんらかの要因があるはずなのです。その不良品のデータを結果とし、その結果を生み出していると考えられる要因のデータを集めたのです。

Aという要因、Bという要因、Cという要因…。製造現場で地道にデータを集めました。その要因は量的データで数値化できるものは測定し、その要因があるかないかといった質的データもカウントをし、データを集めました。

どの要因が働いているときに不具合が増加するか、どの要因の数値が大きくなったら不具合がをデータで調べたのです。

ここで、かけるコストと得られる成果の関係からみて重要なのは、データをやみくもに集めればよいわけではなく、あたりを付けてから集めるということです。ひょっとしたらこれが原因なのではないか?と考え、仮説を立てたことに関して、データを集め、分析にかけるのです。手当たり次第にデータを集めると時間がいくらあっても足りません。コストをかけたのにも関わらず、成果が出ないことになってしまいます。

この要因をこう変化させれば、不具合がこれだけ無くなる、とデータで語ることができ、実際に製造のやり方を変更したところ、生産量全体の10%以上、不良を減らすことができました。

社会調査でも統計学が活きる

これは、社会調査でも同じことです。19世紀のイギリスのロンドンでは、コレラが流行していました。

高度な教育を受けた知識の豊富な科学者や医者が、知恵を出し合って行った対策も、多数の死亡者を出すコレラの流行を止めることができませんでした。

この事態を疫学によって解決したのが、ジョン・スノウです。原因がわからない疫病を防止するための学問のことを疫学といいます。

ジョン・スノウはコレラで亡くなった人の家を訪問し話を聞き、亡くなった人が多い場所の環境を調べました。データを集め、コレラにかかった人と、かかっていな人の違いを調べ、仮説検証をしました。

その結果、コレラにかかった人が多い家は、ある水道会社を利用していた家でした。そこだけコレラの発生率が高くなっていることがわかりました。スノウのレポートによると、その水道会社を利用している家は、1万軒あたりの死亡者数は315人、いっぽうで他の水道会社を利用している家は、1万軒あたりの死亡者数は37人という調査結果。

ここでスノウが出したコレラ流行への対策は、その水道会社の利用をやめる、というものでした。

コレラの原因はコレラ菌の経口感染によるものですが、スノウが、その水道会社の利用をやめると解決策を提言したときには、まだ、コレラ菌というものが存在していることはわかっていませんでした。

その水道会社は、ロンドンを流れるテムズ川の下流域から、採水していたのです。ロンドンでは人々の汚物が川に流し込まれていて、それが原因であったのです。

このときは、コレラという病原菌も発症のメカニズムも、水道会社の利用がなぜダメなのかもわかっていなかったのに、解決策を提示することができたのです。

コレラ菌が証明されたのは、後年になってからです。

統計学を活用すれば問題解決できる

これら話は、その問題の原因詳細や発生メカニズムがわからなくても、データを集めて分析することで、問題解決策を導けることを示しています。

これは、統計学、あるいは品質管理の強みでしょう。私自身も、自分の仕事で原因のわからない問題をデータ分析によって解決したときに、そう感じました。