いしかわ こうや

割とメモ帳替わりに使ってます

いしかわ こうや

割とメモ帳替わりに使ってます

記事一覧

2月成果報告

- 英語学習英語学習単体でやる事はあまりなかった。 リスニングと多読精読辺りは今後やっていきたい。 家に英語耳とTOEIC公式リスニング集があるのでそこらへんでリスニ…

2月目標

月の目標と立ててそれをどれだけ達成できるかメモ - 英語学習ここは通年の目標になりそう。 とりあえず、論文読みや教科書で補う - 情報系基礎知識の学習ここで紹介され…

Cryptocurrency Portfolio Management with Deep Reinforcement Learning

タイトル 『Cryptocurrency Portfolio Management with Deep Reinforcement Learning』(IntelliSys 2017) 著者 Zhengyao Jiang, Jinjun Liang 概要 強化学習を用いた仮想…

Never Give Up: Learning Directed Exploration Strategies

タイトル 『Never Give Up: Learning Directed Exploration Strategies』(ICLR 2020) (URL: https://openreview.net/forum?id=Sye57xStvB) 著者 『Adrià Puigdomènech B…

Portfolio Management using Reinforcement Learning

タイトル 『Portfolio Management using Reinforcement Learning』(2016) (URL:http://cs229.stanford.edu/proj2016/report/JinElSaawy-PortfolioManagementusingReinforce

Stabilizing Transformers for Reinforcement Learning Emilio

タイトル 『Stabilizing Transformers for Reinforcement Learning Emilio』(ICML 2020) (URL:https://arxiv.org/abs/1910.06764) 著者 Emilio Parisotto, H. Francis So…

Agent57: Outperforming the Atari Human Benchmark

タイトル 『Agent57: Outperforming the Atari Human Benchmark』(ICML 2020)(URL:https://arxiv.org/abs/2003.13350) 著者 Adrià Puigdomènech Badia, Bilal Piot, Ste…

RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING

タイトル 『RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING』(ICLR 2019)(URL:https://openreview.net/forum?id=r1lyTjAqYX) 著者 Steven Kapturow…

Deep Direct Reinforcement Learning for Financial Signal Representation and Trading

タイトル 『Deep Direct Reinforcement Learning for Financial Signal Representation and Trading』 (IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, VOL.…

DISTRIBUTED PRIORITIZED EXPERIENCE REPLAY

タイトル 『DISTRIBUTED PRIORITIZED EXPERIENCE REPLAY』(ICLR 2018) (URL: https://openreview.net/forum?id=H1Dy---0Z) 著者 Dan Horgan, John Quan, David Budden, Ga…

Massively Parallel Methods for Deep Reinforcement Learning

タイトル 『Massively Parallel Methods for Deep Reinforcement Learning』(ICML 2015) (URL:https://arxiv.org/abs/1507.04296) 著者 Arun Nair, Praveen Srinivasan, …

Rainbow: Combining Improvements in Deep Reinforcement Learning

タイトル 『Rainbow: Combining Improvements in Deep Reinforcement Learning』 (AAAI2018) (URL:https://arxiv.org/abs/1710.02298) 著者 Matteo Hessel, Joseph Moday…

Dueling Network Architectures for Deep Reinforcement Learning

タイトル 『Dueling Network Architectures for Deep Reinforcement Learning』 (ICML 2016) (URL:http://proceedings.mlr.press/v48/wangf16.html) 著者 Ziyu Wang, Tom …

Computational Learning Techniques for Intraday FX Trading Using Popular Technical Indicators

タイトル 『Computational Learning Techniques for Intraday FX Trading Using Popular Technical Indicators』(IEEE TRANSACTIONS ON NEURAL NETWORKS, VOL. 12, NO. 4, …

PRIORITIZED EXPERIENCE REPLAY

タイトル 『PRIORITIZED EXPERIENCE REPLAY』(ICRL 2016) (URL: https://arxiv.org/abs/1511.05952) 著者 Tom Schaul, John Quan, Ioannis Antonoglou, David Silver 概…

Deep Reinforcement Learning with Double Q-learning

タイトル 『Deep Reinforcement Learning with Double Q-learning』(AAAI 2016) (URL:https://arxiv.org/abs/1509.06461) 著者 Hado van Hasselt, Arthur Guez, David Sil…

2月成果報告

- 英語学習英語学習単体でやる事はあまりなかった。

リスニングと多読精読辺りは今後やっていきたい。

家に英語耳とTOEIC公式リスニング集があるのでそこらへんでリスニングは強化したい。

多読はラダー本、精読はなんかいい参考書を探す予定。

- 情報系基礎知識の学習これは完全に頓挫。頓挫衛門。(出典:東海オンエア)
東海オンエアに最近またハマってる。

CPUの創り方を最初に読んだが、これは面

もっとみる

2月目標

月の目標と立ててそれをどれだけ達成できるかメモ

- 英語学習ここは通年の目標になりそう。
とりあえず、論文読みや教科書で補う

- 情報系基礎知識の学習ここで紹介されてる本が良さそうなのでここら辺から

- 強化学習の勉強Sutton本を地道に読んでいく

- 研究今月に論文提出があるので。

Cryptocurrency Portfolio Management with Deep Reinforcement Learning

タイトル
『Cryptocurrency Portfolio Management with Deep Reinforcement Learning』(IntelliSys 2017)

著者
Zhengyao Jiang, Jinjun Liang

概要
強化学習を用いた仮想通貨におけるポートフォリオ最適化の論文。
本論文では方策勾配法のアルゴリズムを用いている(ポートフォリオ最適化の場合アク

もっとみる

Never Give Up: Learning Directed Exploration Strategies

タイトル
『Never Give Up: Learning Directed Exploration Strategies』(ICLR 2020)
(URL: https://openreview.net/forum?id=Sye57xStvB)

著者
『Adrià Puigdomènech Badia, Pablo Sprechmann, Alex Vitvitskyi, Daniel Guo

もっとみる

Stabilizing Transformers for Reinforcement Learning Emilio

タイトル
『Stabilizing Transformers for Reinforcement Learning Emilio』(ICML 2020)
(URL:https://arxiv.org/abs/1910.06764)

著者
Emilio Parisotto, H. Francis Song, Jack W. Rae, Razvan Pascanu, Caglar Gulcehre

もっとみる

Agent57: Outperforming the Atari Human Benchmark

タイトル
『Agent57: Outperforming the Atari Human Benchmark』(ICML 2020)(URL:https://arxiv.org/abs/2003.13350)

著者
Adrià Puigdomènech Badia, Bilal Piot, Steven Kapturowski, Pablo Sprechmann, Alex Vitvitskyi

もっとみる

RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING

タイトル
『RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING』(ICLR 2019)(URL:https://openreview.net/forum?id=r1lyTjAqYX)

著者
Steven Kapturowski, Georg Ostrovski, John Quan, R´emi Munos, Wi

もっとみる

Deep Direct Reinforcement Learning for Financial Signal Representation and Trading

タイトル
『Deep Direct Reinforcement Learning for Financial Signal Representation and Trading』
(IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS, VOL. 28, NO. 3, MARCH 2017)(論文元)

著者
Yue Deng, Fen

もっとみる

DISTRIBUTED PRIORITIZED EXPERIENCE REPLAY

タイトル
『DISTRIBUTED PRIORITIZED EXPERIENCE REPLAY』(ICLR 2018)
(URL: https://openreview.net/forum?id=H1Dy---0Z)

著者
Dan Horgan, John Quan, David Budden, Gabriel Barth-Maron, Matteo Hessel, Hado van Hasse

もっとみる

Massively Parallel Methods for Deep Reinforcement Learning

タイトル
『Massively Parallel Methods for Deep Reinforcement Learning』(ICML 2015)
(URL:https://arxiv.org/abs/1507.04296)

著者
Arun Nair, Praveen Srinivasan, Sam Blackwell, Cagdas Alcicek, Rory Fearon, Ales

もっとみる

Rainbow: Combining Improvements in Deep Reinforcement Learning

タイトル
『Rainbow: Combining Improvements in Deep Reinforcement Learning』
(AAAI2018) (URL:https://arxiv.org/abs/1710.02298)

著者
Matteo Hessel, Joseph Modayil, Hado van Hasselt, Tom Schaul, Georg Ostrovski

もっとみる

Dueling Network Architectures for Deep Reinforcement Learning

タイトル
『Dueling Network Architectures for Deep Reinforcement Learning』
(ICML 2016) (URL:http://proceedings.mlr.press/v48/wangf16.html)

著者
Ziyu Wang, Tom Schaul, Matteo Hessel, Hado Hasselt, Marc Lancto

もっとみる

Computational Learning Techniques for Intraday FX Trading Using Popular Technical Indicators

タイトル
『Computational Learning Techniques for Intraday FX Trading Using Popular Technical Indicators』(IEEE TRANSACTIONS ON NEURAL NETWORKS, VOL. 12, NO. 4, JULY 2001)
(URL:https://ieeexplore.ieee.org/ab

もっとみる

PRIORITIZED EXPERIENCE REPLAY

タイトル
『PRIORITIZED EXPERIENCE REPLAY』(ICRL 2016)
(URL: https://arxiv.org/abs/1511.05952)

著者
Tom Schaul, John Quan, Ioannis Antonoglou, David Silver

概要
従来の経験再生はリプレイメモリからランダムにサンプリングしてくるだけだったが、サンプリングの仕方

もっとみる

Deep Reinforcement Learning with Double Q-learning

タイトル
『Deep Reinforcement Learning with Double Q-learning』(AAAI 2016)
(URL:https://arxiv.org/abs/1509.06461)

著者
Hado van Hasselt, Arthur Guez, David Silver

概要
DQNとDouble Q-learningを組み合わせた"Double DQN"

もっとみる