いしかわ　こうや

割とメモ帳替わりに使ってます

2 フォロー 3 フォロワー

2月成果報告

- 英語学習英語学習単体でやる事はあまりなかった。リスニングと多読精読辺りは今後やっていきたい。家に英語耳とTOEIC公式リスニング集があるのでそこらへんでリスニ…

いしかわ　こうや

3年前

2月目標

月の目標と立ててそれをどれだけ達成できるかメモ - 英語学習ここは通年の目標になりそう。とりあえず、論文読みや教科書で補う - 情報系基礎知識の学習ここで紹介され…

いしかわ　こうや

3年前

Cryptocurrency Portfolio　Management with Deep　Reinforcement Learning

タイトル『Cryptocurrency Portfolio Management with Deep Reinforcement Learning』(IntelliSys 2017) 著者 Zhengyao Jiang, Jinjun Liang 概要強化学習を用いた仮想…

いしかわ　こうや

3年前

Never Give Up: Learning Directed Exploration Strategies

タイトル『Never Give Up: Learning Directed Exploration Strategies』(ICLR 2020) (URL: https://openreview.net/forum?id=Sye57xStvB) 著者『Adrià Puigdomènech B…

いしかわ　こうや

3年前

Portfolio Management using Reinforcement Learning

タイトル『Portfolio Management using Reinforcement Learning』(2016) (URL:http://cs229.stanford.edu/proj2016/report/JinElSaawy-PortfolioManagementusingReinforce…

いしかわ　こうや

3年前

Stabilizing Transformers for Reinforcement Learning Emilio

タイトル『Stabilizing Transformers for Reinforcement Learning Emilio』(ICML 2020) (URL:https://arxiv.org/abs/1910.06764) 著者 Emilio Parisotto, H. Francis So…

いしかわ　こうや

3年前

Agent57: Outperforming the Atari Human Benchmark

タイトル『Agent57: Outperforming the Atari Human Benchmark』(ICML 2020)(URL:https://arxiv.org/abs/2003.13350) 著者 Adrià Puigdomènech Badia, Bilal Piot, Ste…

いしかわ　こうや

3年前

RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING

タイトル『RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING』(ICLR 2019)(URL:https://openreview.net/forum?id=r1lyTjAqYX) 著者 Steven Kapturow…

いしかわ　こうや

3年前

Deep Direct Reinforcement Learning for Financial Signal Representation and Trading

タイトル『Deep Direct Reinforcement Learning for Financial Signal Representation and Trading』 (IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, VOL.…

いしかわ　こうや

3年前

DISTRIBUTED PRIORITIZED　EXPERIENCE REPLAY

タイトル『DISTRIBUTED PRIORITIZED EXPERIENCE REPLAY』(ICLR 2018) (URL: https://openreview.net/forum?id=H1Dy---0Z) 著者 Dan Horgan, John Quan, David Budden, Ga…

いしかわ　こうや

3年前

Massively Parallel Methods for Deep Reinforcement Learning

タイトル『Massively Parallel Methods for Deep Reinforcement Learning』(ICML 2015) (URL:https://arxiv.org/abs/1507.04296) 著者 Arun Nair, Praveen Srinivasan, …

いしかわ　こうや

3年前

Rainbow: Combining Improvements in Deep Reinforcement Learning

タイトル『Rainbow: Combining Improvements in Deep Reinforcement Learning』 (AAAI2018)　(URL:https://arxiv.org/abs/1710.02298) 著者 Matteo Hessel, Joseph Moday…

いしかわ　こうや

3年前

Dueling Network Architectures for Deep Reinforcement Learning

タイトル『Dueling Network Architectures for Deep Reinforcement Learning』 (ICML 2016) (URL:http://proceedings.mlr.press/v48/wangf16.html) 著者 Ziyu Wang, Tom …

いしかわ　こうや

3年前

Computational Learning Techniques for Intraday FX Trading Using Popular Technical Indicators

タイトル『Computational Learning Techniques for Intraday FX Trading Using Popular Technical Indicators』(IEEE TRANSACTIONS ON NEURAL NETWORKS, VOL. 12, NO. 4, …

いしかわ　こうや

3年前

PRIORITIZED EXPERIENCE REPLAY

タイトル『PRIORITIZED EXPERIENCE REPLAY』(ICRL 2016) (URL: https://arxiv.org/abs/1511.05952) 著者 Tom Schaul, John Quan, Ioannis Antonoglou, David Silver 概…

いしかわ　こうや

3年前

Deep Reinforcement Learning with Double Q-learning

タイトル『Deep Reinforcement Learning with Double Q-learning』(AAAI 2016) (URL:https://arxiv.org/abs/1509.06461) 著者 Hado van Hasselt, Arthur Guez, David Sil…

いしかわ　こうや

3年前

いしかわ　こうや

2021年2月28日 14:41

2月成果報告

- 英語学習英語学習単体でやる事はあまりなかった。

リスニングと多読精読辺りは今後やっていきたい。

家に英語耳とTOEIC公式リスニング集があるのでそこらへんでリスニングは強化したい。

多読はラダー本、精読はなんかいい参考書を探す予定。

- 情報系基礎知識の学習これは完全に頓挫。頓挫衛門。(出典：東海オンエア)
東海オンエアに最近またハマってる。

CPUの創り方を最初に読んだが、これは面

もっとみる

いしかわ　こうや

2021年1月31日 15:53

2月目標

月の目標と立ててそれをどれだけ達成できるかメモ

- 英語学習ここは通年の目標になりそう。
とりあえず、論文読みや教科書で補う

- 情報系基礎知識の学習ここで紹介されてる本が良さそうなのでここら辺から

- 強化学習の勉強Sutton本を地道に読んでいく

- 研究今月に論文提出があるので。

いしかわ　こうや

2020年9月23日 13:44

Cryptocurrency Portfolio　Management with Deep　Reinforcement Learning

タイトル
『Cryptocurrency Portfolio Management with Deep Reinforcement Learning』(IntelliSys 2017)

著者
Zhengyao Jiang, Jinjun Liang

概要
強化学習を用いた仮想通貨におけるポートフォリオ最適化の論文。
本論文では方策勾配法のアルゴリズムを用いている(ポートフォリオ最適化の場合アク

もっとみる

いしかわ　こうや

2020年9月21日 14:16

Never Give Up: Learning Directed Exploration Strategies

タイトル
『Never Give Up: Learning Directed Exploration Strategies』(ICLR 2020)
(URL: https://openreview.net/forum?id=Sye57xStvB)

著者
『Adrià Puigdomènech Badia, Pablo Sprechmann, Alex Vitvitskyi, Daniel Guo

もっとみる

いしかわ　こうや

2020年9月18日 12:12

Portfolio Management using Reinforcement Learning

タイトル
『Portfolio Management using Reinforcement Learning』(2016)
(URL:http://cs229.stanford.edu/proj2016/report/JinElSaawy-PortfolioManagementusingReinforcementLearning-report.pdf)

著者
O Jin, H El-Saawy

もっとみる

いしかわ　こうや

2020年9月17日 12:15

Stabilizing Transformers for Reinforcement Learning Emilio

タイトル
『Stabilizing Transformers for Reinforcement Learning Emilio』(ICML 2020)
(URL:https://arxiv.org/abs/1910.06764)

著者
Emilio Parisotto, H. Francis Song, Jack W. Rae, Razvan Pascanu, Caglar Gulcehre

もっとみる

いしかわ　こうや

2020年9月16日 12:22

Agent57: Outperforming the Atari Human Benchmark

タイトル
『Agent57: Outperforming the Atari Human Benchmark』(ICML 2020)(URL:https://arxiv.org/abs/2003.13350)

著者
Adrià Puigdomènech Badia, Bilal Piot, Steven Kapturowski, Pablo Sprechmann, Alex Vitvitskyi

もっとみる

いしかわ　こうや

2020年9月15日 12:28

RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING

タイトル
『RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING』(ICLR 2019)(URL:https://openreview.net/forum?id=r1lyTjAqYX)

著者
Steven Kapturowski, Georg Ostrovski, John Quan, R´emi Munos, Wi

もっとみる

いしかわ　こうや

2020年9月15日 11:55

Deep Direct Reinforcement Learning for Financial Signal Representation and Trading

タイトル
『Deep Direct Reinforcement Learning for Financial Signal Representation and Trading』
(IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, VOL. 28, NO. 3, MARCH 2017)(論文元)

著者
Yue Deng, Fen

もっとみる

いしかわ　こうや

2020年9月14日 12:15

DISTRIBUTED PRIORITIZED　EXPERIENCE REPLAY

タイトル
『DISTRIBUTED PRIORITIZED EXPERIENCE REPLAY』(ICLR 2018)
(URL: https://openreview.net/forum?id=H1Dy---0Z)

著者
Dan Horgan, John Quan, David Budden, Gabriel Barth-Maron, Matteo Hessel, Hado van Hasse

もっとみる

いしかわ　こうや

2020年9月11日 12:11

Massively Parallel Methods for Deep Reinforcement Learning

タイトル
『Massively Parallel Methods for Deep Reinforcement Learning』(ICML 2015)
(URL:https://arxiv.org/abs/1507.04296)

著者
Arun Nair, Praveen Srinivasan, Sam Blackwell, Cagdas Alcicek, Rory Fearon, Ales

もっとみる

いしかわ　こうや

2020年9月10日 15:55

Rainbow: Combining Improvements in Deep Reinforcement Learning

タイトル
『Rainbow: Combining Improvements in Deep Reinforcement Learning』
(AAAI2018)　(URL:https://arxiv.org/abs/1710.02298)

著者
Matteo Hessel, Joseph Modayil, Hado van Hasselt, Tom Schaul, Georg Ostrovski

もっとみる

いしかわ　こうや

2020年9月10日 15:00

Dueling Network Architectures for Deep Reinforcement Learning

タイトル
『Dueling Network Architectures for Deep Reinforcement Learning』
(ICML 2016) (URL:http://proceedings.mlr.press/v48/wangf16.html)

著者
Ziyu Wang, Tom Schaul, Matteo Hessel, Hado Hasselt, Marc Lancto

もっとみる

いしかわ　こうや

2020年9月9日 14:49

Computational Learning Techniques for Intraday FX Trading Using Popular Technical Indicators

タイトル
『Computational Learning Techniques for Intraday FX Trading Using Popular Technical Indicators』(IEEE TRANSACTIONS ON NEURAL NETWORKS, VOL. 12, NO. 4, JULY 2001)
(URL:https://ieeexplore.ieee.org/ab

もっとみる

いしかわ　こうや

2020年9月8日 11:53

PRIORITIZED EXPERIENCE REPLAY

タイトル
『PRIORITIZED EXPERIENCE REPLAY』(ICRL 2016)
(URL: https://arxiv.org/abs/1511.05952)

著者
Tom Schaul, John Quan, Ioannis Antonoglou, David Silver

概要
従来の経験再生はリプレイメモリからランダムにサンプリングしてくるだけだったが、サンプリングの仕方

もっとみる

いしかわ　こうや

2020年9月8日 10:58

Deep Reinforcement Learning with Double Q-learning

タイトル
『Deep Reinforcement Learning with Double Q-learning』(AAAI 2016)
(URL:https://arxiv.org/abs/1509.06461)

著者
Hado van Hasselt, Arthur Guez, David Silver

概要
DQNとDouble Q-learningを組み合わせた"Double DQN"

もっとみる

記事一覧

2月成果報告

2月目標

Cryptocurrency Portfolio Management with Deep Reinforcement Learning

Never Give Up: Learning Directed Exploration Strategies

Portfolio Management using Reinforcement Learning

Stabilizing Transformers for Reinforcement Learning Emilio

Agent57: Outperforming the Atari Human Benchmark

RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING

Deep Direct Reinforcement Learning for Financial Signal Representation and Trading

DISTRIBUTED PRIORITIZED EXPERIENCE REPLAY

Massively Parallel Methods for Deep Reinforcement Learning

Rainbow: Combining Improvements in Deep Reinforcement Learning

Dueling Network Architectures for Deep Reinforcement Learning

Computational Learning Techniques for Intraday FX Trading Using Popular Technical Indicators

PRIORITIZED EXPERIENCE REPLAY

Deep Reinforcement Learning with Double Q-learning

Cryptocurrency Portfolio　Management with Deep　Reinforcement Learning

DISTRIBUTED PRIORITIZED　EXPERIENCE REPLAY