外れ値とその対策方法について
外れ値とは?外れ値とは、データセットの中で他のデータポイントと比べて極端に異なる値のことを指します。これらの値は統計指標を歪め、機械学習モデルの性能に悪影響を与える可能性があります。
この記事では、外れ値の検出とその対策方法について見ていきたいと思います。今回はScikit-learnライブラリに含まれるIrisデータセットを利用します。
Irisデータセットは、アヤメ属の3種類の花(Iris setosa, Iris versicolor, Iris virginica