標本データにおける外れ値の考え方②
こんにちは、データ分析の際に厄介者として扱われがちな外れ値について考えてきたいと思います。
外れ値とは、「データのメインボディから外れている値」のことをいいます。例えば、以下のようなデータがあるとき、25.5は怪しいと考えるのは自然だと思います。
$$
\mathcal{X} = \{5.6, 5.7, 5.4, 5.5, 5.2, 5.3, 5.8, 5.4, 5.6, 25.5 \}
$$
このような、値が現れたときにどのように考えていくかを書いていきます。
※こ