szhangml

I am an Applied Scientist II at AWS AI

AWS

Pinned Repositories

Q-Learning-LFA
Chen, Z., Zhang, S., Doan, T. T., Clarke, J. P., & Maguluri, S. T. (2019). Finite-sample analysis of nonlinear stochastic approximation with applications in reinforcement learning.
Language:Python1 3 01
Average-Reward-TD-Q-Learning
Code for the numerical experiments in Zhang, Sheng, Zhe Zhang, and Siva Theja Maguluri. "Finite Sample Analysis of Average-Reward TD Learning and Q-Learning."
Language:Python2 1 00
DouZero
[ICML 2021] DouZero: Mastering DouDizhu with Self-Play Deep Reinforcement Learning | 斗地主AI
Language:Python00
szhangml.github.io
Language:JavaScript0 1 00

szhangml's Repositories

szhangml/Average-Reward-TD-Q-Learning
Code for the numerical experiments in Zhang, Sheng, Zhe Zhang, and Siva Theja Maguluri. "Finite Sample Analysis of Average-Reward TD Learning and Q-Learning."
Language:Python2 1 00
szhangml/DouZero
[ICML 2021] DouZero: Mastering DouDizhu with Self-Play Deep Reinforcement Learning | 斗地主AI
Language:Python00
szhangml/szhangml.github.io
Language:JavaScript0 1 00