scikit-learn機械学習⑬ランダム・フォレスト

2024年5月11日 22:52

前回は、scikit-learnのDecisionTreeClassifierを使って決定木（Decision Tree）の実験を行いました。今回は、その知識をさらに拡張して、ランダム・フォレスト（Random Forest）について解説します。

大雑把に説明すると、ランダム・フォレストはたくさんの決定木を作って、それぞれの決定木に予測をさせます。そして、一番多くの「投票」を得たクラスがモデルの予測として採用されます。決定するための木がたくさんあるのでフォレスト（森）というわけです。

一見、同じ訓練データセットから多くの決定木を作ると、すべて同じような予測しか出ないように思えますが、そんなことはありません。

ランダム・フォレストは、バギング（Bagging）というアンサンブル学習法をベースにしており、ブートストラップ法（Bootstrap method）を用いるため、各決定木にランダムな訓練データを取得することができます。さらに、ランダム・フォレストはバギングにある改良を加えてより一般化能力が高くなる工夫がなされています。

この記事では、これらの概念の解説を行い、ランダム・フォレストの中身を深掘りします。

ここから先は

5,160字 / 9画像

キカベン・読み放題

¥1,000 / 月

初月無料

人工知能、機械学習、ディープラーニング関連の用語説明、研究論文の概要、プログラミングの具体例などの読み応えのある新しい記事が月に４−５本ほど追加されます。また、気になるAIニュースや日常の雑観などは随時公開しています。

メンバー限定の会員証が発行されます
活動期間に応じたバッジを表示
メンバー限定掲示板を閲覧できます
メンバー特典記事を閲覧できます
メンバー特典マガジンを閲覧できます

このメンバーシップの詳細

ログイン

この記事が気に入ったらサポートをしてみませんか？