見出し画像

scikit-learn機械学習⑯アダブースト実践編

前回は、アダブーストの理論的な側面を紹介しました。今回は、scikit-learnを使って簡単な実験を行います。

今回使うデータセット digits数字の画像データです。各数字は、8x8ピクセルの画像で、ラベルは0から9までの10個のクラスになります。

以下は、digits からのサンプル画像です。

scikit-learn digits データセットからのサンプル

このような画像を scikit-learnの AdaBoostClassifier で分類します。

まず、いつものように探索的なデータ分析を行います。次に、データセットを訓練データと評価データに分割し、訓練データにモデルをフィットさせます。そして、評価データでモデルの性能を吟味します。

今回は、画像データが特徴量となっているのでいつもとは少し勝手が違います。また、ディープラーニングのような畳み込みを使うわけでもありません。

さて、アダブーストは、弱学習器によるアンサンブル学習の一種であるブースティングのアルゴリズムを使っていますが、画像分類において良い結果を生み出すことができるでしょうか。


ここから先は

12,983字 / 11画像

キカベン・読み放題

¥1,000 / 月
初月無料
このメンバーシップの詳細

この記事が気に入ったらサポートをしてみませんか?