brett-daley

Computing science PhD candidate @ualberta. Researching reinforcement learning and deep learning.

University of AlbertaEdmonton, AB

Pinned Repositories

a3c
Language:Python1 3 00
averaging-nstep-returns
ICML 2024: Averaging n-step Returns Reduces Variance in Reinforcement Learning
Language:Python1 1 00
brett-daley.github.io
Language:HTML2 3 01
dqn-lambda
NeurIPS 2019: DQN(λ) = Deep Q-Network + λ-returns.
Language:Python24 4 15
expectigrad
A deep learning optimizer with reliable convergence. Supports Pytorch and TensorFlow 1 & 2.
Language:Python1 3 01
fast-dqn
A concurrent/synchronized DQN implementation optimized for multi-CPU, single-GPU systems.
Language:Python8 3 00
gym-classics
Classic environments for reinforcement learning and dynamic programming, implemented in OpenAI Gym and Gymnasium.
Language:Python19 5 43
stratified-experience-replay
Stratified Experience Replay. Correcting Multiplicity Bias in Off-Policy Deep Reinforcement Learning. AAMAS 2021.
Language:Python6 3 00
trajectory-aware-etraces
ICML 2023: Trajectory-Aware Eligibility Traces for Off-Policy Reinforcement Learning. https://arxiv.org/abs/2301.11321
Language:Python1 4 00
virtual-replay-cache
Virtual Replay Cache. A modified DQN(λ) implementation with a significantly reduced memory footprint.
Language:Python2 3 00

brett-daley's Repositories

brett-daley/dqn-lambda
NeurIPS 2019: DQN(λ) = Deep Q-Network + λ-returns.
Language:Python24 4 15
brett-daley/gym-classics
Classic environments for reinforcement learning and dynamic programming, implemented in OpenAI Gym and Gymnasium.
Language:Python19 5 43
brett-daley/fast-dqn
A concurrent/synchronized DQN implementation optimized for multi-CPU, single-GPU systems.
Language:Python8 3 00
brett-daley/stratified-experience-replay
Stratified Experience Replay. Correcting Multiplicity Bias in Off-Policy Deep Reinforcement Learning. AAMAS 2021.
Language:Python6 3 00
brett-daley/brett-daley.github.io
Language:HTML2 3 01
brett-daley/virtual-replay-cache
Virtual Replay Cache. A modified DQN(λ) implementation with a significantly reduced memory footprint.
Language:Python2 3 00
brett-daley/a3c
Language:Python1 3 00
brett-daley/averaging-nstep-returns
ICML 2024: Averaging n-step Returns Reduces Variance in Reinforcement Learning
Language:Python1 1 00
brett-daley/expectigrad
A deep learning optimizer with reliable convergence. Supports Pytorch and TensorFlow 1 & 2.
Language:Python1 3 01
brett-daley/trajectory-aware-etraces
ICML 2023: Trajectory-Aware Eligibility Traces for Off-Policy Reinforcement Learning. https://arxiv.org/abs/2301.11321
Language:Python1 4 00
brett-daley/pfrl
PFRL: a PyTorch-based deep reinforcement learning library
Language:Python0 1 00
brett-daley/MinAtar
brett-daley/recency-heuristic
RLC 2024: Demystifying the Recency Heuristic in Temporal-Difference Learning
Language:Python1 0

brett-daley

Pinned Repositories

a3c

averaging-nstep-returns

brett-daley.github.io

dqn-lambda

expectigrad

fast-dqn

gym-classics

stratified-experience-replay

trajectory-aware-etraces

virtual-replay-cache

brett-daley's Repositories

brett-daley/dqn-lambda

brett-daley/gym-classics

brett-daley/fast-dqn

brett-daley/stratified-experience-replay

brett-daley/brett-daley.github.io

brett-daley/virtual-replay-cache

brett-daley/a3c

brett-daley/averaging-nstep-returns

brett-daley/expectigrad

brett-daley/trajectory-aware-etraces

brett-daley/pfrl

brett-daley/MinAtar

brett-daley/recency-heuristic