機械学習の過学習と人生の過学習: 類似点と対策

おはようございます。渡部です。ふと日曜日に息抜きでKaggleをやっていたら思いついたことがあったので書き留めておきます。

はじめに

過学習(Overfitting)とは、機械学習のモデルが訓練データに対しては非常に良い性能を示すが、新しいデータに対してはうまく機能しない現象をいいます。この問題って人生にも見られるんじゃないかとおもい、今日はその類似点と対策について語ります。

過学習 in 機械学習

問題点

機械学習モデルが訓練データに"過度に適合"すると、新しいデータに対応できなくなります。

対策

  1. Hold Out法: データを学習用とテスト用に分けて、過学習を防ぎます。

Hold Out法: データを2つに分けてみる

まず、持っているデータを二つのグループに分けます。一つは「学習用」、もう一つは「テスト用」。学習用データでモデルを作ります。作ったモデルをテスト用データで試してみて、どれくらい当たっているか確認します。
この方法は簡単ですが、テスト用データが偏っていると、正確な評価ができないこともあります。検証用は未知データなので推量するには良い方法です。

  1. Cross Validation法: 複数の小さいデータセットでモデルを試し、より一般的な解を求めます。

Cross Validation法: みんなの力を借りて精度を上げる
データを数個の小さいグループ(K個)に分けます。一つの小さいグループをテスト用に、残りを学習用に使ってモデルを作ります。
この作業をK回繰り返して、それぞれのモデルの平均的な精度を測ります。
この方法はちょっと手間がかかりますが、より信頼性のあるモデルが作れることが多いです。

過学習 in 人生

問題点

成功した環境や経験がそのまま別の場で通用するとは限らない。例えば、優秀な大学や有名企業で成功を収めても、新しい環境でなかなか結果がでないこと、特に古い方法に固執して失敗することがあります。

対策

  1. "人生のHold Out法": 自分のスキルや経験を新しい環境で試してみる。すべての環境でうまく行くわけではないので、柔軟に適応する必要があります。看板の中で一つやっているのではなく、違う組織や分野で経験をその大学や企業でやっている人の方が、新しい会社でも適応しやすいかもしれません。

  2. "人生のCross Validation法": 異なる環境や人々と関わり、多角的に自分自身を評価する。これによって、一つの成功体験に依存することなく、より広い視野で物事を考えられます。例えば上の人生のHildoutに加えてMBAや副業やらで客観的な評価を行っている方がよいかもしれませんね。

まとめ

過学習は機械学習だけでなく、人生にも適用されるコンセプトです(多分n)。柔軟な思考と適応能力が、機械も人も共通して求められるスキルと言えるのではないかなと思った次第。

この記事が気に入ったらサポートをしてみませんか?