マガジンのカバー画像

Pythonによる最適化

249
最適化やデータ解析はPythonを使うと瞬時にできるよ,という話です.
運営しているクリエイター

#強化学習

強化学習の勉強方法

学生さんが強化学習に興味を持っていて,勉強方法を聞かれたので,まとめてみました.

私自身は Deep MindのDavid Silverさんの連続講義で勉強しました.サイトはこちらです.

この講義のテキストは有名な Sutton & Bartoの Reinforcement Learning: An Introduction で,上の講義ページからpdfファイルをダウンロードできます.

スラ

もっとみる

強化学習

Deep Mind のDavid Silverさんのスライドをもとに強化学習のビデオをとってみました.これが最初のもので,そのあとLecture 10まで投稿予定です.

動的確率的配送計画に対する強化学習と最適化を合わせた解法

1日のトラックの配送順を決める問題は,配送計画問題として知られている.実際の問題においては,需要の不確実性が無視できない場合がある.典型的な2つのケースをあげておく.

・宅配のラストワンマイルにおける不在確率の考慮
・乗り合いタクシー問題

これらは,応用別に解法を設計する必要があると考えているが,ここではその基礎になる手法を考える.元になるのは,最適化と強化学習(近似動的計画)である.

一部

もっとみる

分布型深層強化学習

在庫の最適化に深層強化学習を適用したという論文はいくつか出ているが、どれも成功しているとは言えないものだった。

理由は、需要の不確実性が大きいのと、品切れという発生確率が小さいイベントで大きな費用がかかるので、学習がうまくできないことにあると考えられる。

最近の深層強化学習の進展はめざましく、囲碁や将棋だけでなく、より複雑なゲームでも人間以上の性能を示しようになっている。そもそもはATARIゲ

もっとみる
TF-Agentsによる強化学習

TF-Agentsによる強化学習

TensorFlowがバージョンアップして強化学習用のライブラリ TF-Agentsが使えるようになったようだ。fastaiは強化深層学習はサポートしないそうなので、RLがしたいときにはこれを使えば良い。

ただプログラムはあまり綺麗ではなく、Pythonのバージョンも2のようだ。ChainerもRLに力を入れているようなので、比較して良い方を使うべきだろう。

SAC(Soft Actor Cr

もっとみる

データサイエンティスト養成講座

日本で自称データサイエンティストと言うのが増えているが、以下のタイプが多い気がする。

1)大学の統計確率を教えていた先生が、急にデータサイエンティストを養成しろと言われて、講義をしている。大抵はプログラムが書けないし、最先端の深層学習の論文などは読んだことがなく、古典的な統計を教えている。

2)企業で上司命令で勉強しながら簡単なプロジェクトをやった経験がある。例えば、推奨システムを作れと言われ

もっとみる