Pythonによる最適化

学生さんが強化学習に興味を持っていて，勉強方法を聞かれたので，まとめてみました．

私自身は Deep MindのDavid Silverさんの連続講義で勉強しました．サイトはこちらです．

この講義のテキストは有名な Sutton & Bartoの Reinforcement Learning: An Introduction で，上の講義ページからpdfファイルをダウンロードできます．

スラ

もっとみる

Mikio Kubo

2022年1月7日 03:41

強化学習

Deep Mind のDavid Silverさんのスライドをもとに強化学習のビデオをとってみました．これが最初のもので，そのあとLecture 10まで投稿予定です．

Mikio Kubo

2021年12月14日 15:24

動的確率的配送計画に対する強化学習と最適化を合わせた解法

1日のトラックの配送順を決める問題は，配送計画問題として知られている．実際の問題においては，需要の不確実性が無視できない場合がある．典型的な2つのケースをあげておく．

・宅配のラストワンマイルにおける不在確率の考慮
・乗り合いタクシー問題

これらは，応用別に解法を設計する必要があると考えているが，ここではその基礎になる手法を考える．元になるのは，最適化と強化学習（近似動的計画）である．

一部

もっとみる

Mikio Kubo

2019年5月6日 12:07

分布型深層強化学習

在庫の最適化に深層強化学習を適用したという論文はいくつか出ているが、どれも成功しているとは言えないものだった。

理由は、需要の不確実性が大きいのと、品切れという発生確率が小さいイベントで大きな費用がかかるので、学習がうまくできないことにあると考えられる。

最近の深層強化学習の進展はめざましく、囲碁や将棋だけでなく、より複雑なゲームでも人間以上の性能を示しようになっている。そもそもはATARIゲ

もっとみる

Mikio Kubo

2019年3月10日 11:46

TF-Agentsによる強化学習

TensorFlowがバージョンアップして強化学習用のライブラリ TF-Agentsが使えるようになったようだ。fastaiは強化深層学習はサポートしないそうなので、RLがしたいときにはこれを使えば良い。

ただプログラムはあまり綺麗ではなく、Pythonのバージョンも2のようだ。ChainerもRLに力を入れているようなので、比較して良い方を使うべきだろう。

SAC（Soft Actor Cr

もっとみる

Mikio Kubo

2018年11月18日 10:12

データサイエンティスト養成講座

日本で自称データサイエンティストと言うのが増えているが、以下のタイプが多い気がする。

１）大学の統計確率を教えていた先生が、急にデータサイエンティストを養成しろと言われて、講義をしている。大抵はプログラムが書けないし、最先端の深層学習の論文などは読んだことがなく、古典的な統計を教えている。

２）企業で上司命令で勉強しながら簡単なプロジェクトをやった経験がある。例えば、推奨システムを作れと言われ

もっとみる

フォローしませんか？

#強化学習

強化学習の勉強方法

強化学習

動的確率的配送計画に対する強化学習と最適化を合わせた解法

分布型深層強化学習

TF-Agentsによる強化学習

データサイエンティスト養成講座