MATLABによるQ学習

2022年2月23日 15:58

　AI（Artifical Intelligence、人工知能）を実現する手法の一つに強化学習があります。これは行動と報酬を組み合わせて機械自ら学習手する方法です。この強化学習には様々な方法が提案されていて、その中で最も古典的で有名なのがQ学習です。古典的とはいうものの、現在、様々なAI学習として利用され、その有効性が確かめられています。

　Ｑ学習は冒険的行動（exploreという）も許容するなど、大変理にかなった理解しやすい学習モデルです（とはいうものの、勉強を始めてしばらくの間は、内容を理解するのに苦労しましたが…）。今回、私自身の学習の中で、下に示すような、「アリがケーキまでの最短経路を探す」という問題を使って、その計算アルゴリズムの理解と実装に取り組みました。考え方や計算方法の詳細は下の参考文献をご確認頂き、この記事では、そのMATLABプログラム（ε-greedy法）を紹介します。

参考文献：Excelでわかるディープラーニング超入門 RNN・DQN編（p.140-182)

　プログラムはライブスクリプトを使って作成し, PDF版とm-file版があります。ダウンロードして詳細を確認してください。

ここから先は

0字 / 2ファイル

¥ 100

ログイン

この記事が気に入ったらサポートをしてみませんか？