パラメトリックとノンパラメトリックの違い




標本から得られる値は、母集団分布に従ったばらつきを持っています。母集団から標本を抜き取っているわけですから、母集団がどんな分布なのかによって、標本も変わってくるのは当然ですよね。

このとき、母集団分布の事前の仮定を2パターンに分けることができます。パラメトリックとノンパラメトリックです。

パラメトリック

事前に母集団の分布が、ある確率分布であるとわかっているとき、パラメータがわかれば、母集団の分布がどのようなものか把握することができます。これが、パラメトリックの場合です。

たとえば、正規分布であれば、母集団の平均値、標準偏差の2つを知れば、その分布についてを把握することができます。これらのパラメータを統計的に推測するのです。

統計学入門で説明されるような通常の推定や、t検定などは、母集団が正規分布など特定の分布をしていると仮定していますから、パラメトリックな場合の手法といえます。

データの尺度としては、間隔尺度、または比例尺度になります。

パラメトリック検定は、母集団がある確率分布に従うことがわかっているときに行う検定です。上記したように母集団のデータが正規分布に従うことが明らかになっていて、平均値の検定でt検定をつかうといったことです。

ノンパラメトリック

一方、母集団の分布が事前にはわからず、いくつかのパラメータで母集団分布を決めることができないのが、ノンパラメトリックの場合です。

分布が事前にわからない、母集団が正規分布などの特定の分布をしていないと仮定するので、推定や検定をするときには、分布によらずつかえる手法を用います。

データの尺度は、名義尺度、順位尺度、間隔尺度、比尺度のどれでも問題ありません。

ノンパラメトリックの場合に用いる検定が、ノンパラメトリック検定です。これは、分布によらない検定で、母集団のデータがどのような分布をしていても問題ありません。

  • 母集団が正規性をもっておらず、サンプルサイズも小さいとき
  • 極端な外れ値があって、それを除去できないとき

ノンパラメトリックな手法を陥るのが望ましいです。

ノンパラメトリック検定には、マンホイットニーのU検定、ウィルコクソンの符号順位検定などがあります。データを値の大きさで並べ、その順位情報を用いて検定を行います。

使い分け

まず、パラメトリックな手法が使えないかどうかを考えます。パラメトリックな手法を用いるための前提が満たされないときに、ノンパラメトリックな手法を用いる流れとなります。

パラメトリックな手法がつかえるときに、ノンパラメトリックな手法を用いることは可能ではありますが、検出力の面で若干の不利となるので、パラメトリックをつかうべきです。