見出し画像

MATLABによるQ学習

 AI(Artifical Intelligence、人工知能)を実現する手法の一つに強化学習があります。これは行動と報酬を組み合わせて機械自ら学習手する方法です。この強化学習には様々な方法が提案されていて、その中で最も古典的で有名なのがQ学習です。古典的とはいうものの、現在、様々なAI学習として利用され、その有効性が確かめられています。

 Q学習は冒険的行動(exploreという)も許容するなど、大変理にかなった理解しやすい学習モデルです(とはいうものの、勉強を始めてしばらくの間は、内容を理解するのに苦労しましたが…)。今回、私自身の学習の中で、下に示すような、「アリがケーキまでの最短経路を探す」という問題を使って、その計算アルゴリズムの理解と実装に取り組みました。考え方や計算方法の詳細は下の参考文献をご確認頂き、この記事では、そのMATLABプログラム(ε-greedy法)を紹介します。

アリ(エージェント)がケーキ(報酬)までの最短経路を探す問題

参考文献:Excelでわかるディープラーニング超入門 RNN・DQN編(p.140-182)

 プログラムはライブスクリプトを使って作成し, PDF版とm-file版があります。ダウンロードして詳細を確認してください。

ここから先は

0字 / 2ファイル

¥ 100

この記事が気に入ったらサポートをしてみませんか?