外れ値と異常値の違い




外れ値とは、他のデータからみて、極端に大きな値、または極端に小さな値のことです。そのデータのイメージからかけ離れた値。

異常値とは、外れ値のなかでその原因がわかっているものです。原因としては、測定をミスをしたり、記録のミス、データの入力ミスといった点があります。

極端に小さい値があったからといって、その値が異常とは限りません。外れ値と異常値の区別は簡単ではなく、発生原因をよく考察する必要があります。

外れ値かどうかの判断、除去するかどうかについては、こちらの記事を参考にしてください。

参考記事 外れ値と判定する方法と、外れ値の除去について