見出し画像

強化学習って何?

機械学習の中で学習手法には3つあります。「教師あり」、「教師なし」、強化学習の3つです。詳細な説明は以下のサイトでしてあります。

まとめてみると、「教師あり」は正解を与えてそれに合わせていく学習方法、「教師なし」は正解を与えるのではなくグループ分けをしていき該当するものを見つけていくもの、最後の強化学習については

入力の際、「〇〇できたら+1点」というように、予め報酬を決めておきます。最初コンピューターは「何をしたらいいか分からない」状態にあるため、用意した選択肢の中からランダムに動いてしまいます。しかし、報酬がもらえたときに「どのような状態」で「何をしたら」報酬がもらえたかを記憶していくのです。
次にランダムな動きを残しつつ、前回の記憶を手がかりに動きます。そこで再び報酬がもらえたら、「どのような状態」で「何をした」を記憶していきます。この流れを繰り返すうちに、報酬がもらえる「状態」と「行動」のペアを獲得するようになります。

以下事例の紹介されているサイトです。

もう少し突っ込んでできそうな記事。

そのうちやってみたいことでした。

この記事が気に入ったらサポートをしてみませんか?