決定木の重要なパラメータ

1.max_depth

決定木の深さ
・深ければ深いほど分岐が増え説明力が上がるが
・一方、深すぎると意味のない分岐が増えやすく過学習のリスクがある

2.min_samples_leaf

葉に属する最小サンプル数
・サンプル数が少ないと、信ぴょう性の低い分岐ができる可能性あり


参考:【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門
https://www.udemy.com/course/optworks_1/