zanghyu

PhD student, Reinforcement Learning, Beijing Institute of Technology

Pinned Repositories

offline_bpr
Official implementation of Behavior Prior Representation learning for Offline Reinforcement Learning
Language:Python5 4 00
SimSR
AAAI-22 paper: SimSR: Simple Distance-based State Representationfor Deep Reinforcement Learning
Language:Python7 3 04
facechain
FaceChain is a deep-learning toolchain for generating your Digital-Twin.
Language:Python8.5k 89 297782
a3c-tetris
Language:Python1 3 00
Deep-Reinforcement-Learning-Algorithms-with-PyTorch
PyTorch implementations of deep reinforcement learning algorithms and environments
Language:Python1 3 00
DeepRL
【深度强化学习社区】一个资料与学习内容最全的服务平台
2 3 00
ItChat
A complete and graceful API for Wechat. 微信个人号接口、微信机器人及命令行微信，三十行即可自定义个人号机器人。
Language:Python1 3 00
Offline_Bisimulation
Official implementation of Understanding and Addressing the Pitfalls of Bisimulation-based Representations in Offline Reinforcement Learning
Language:Python1 2 00
RL_note
Language:HTML1 3 00

zanghyu's Repositories

zanghyu/DeepRL
【深度强化学习社区】一个资料与学习内容最全的服务平台
2 3 00
zanghyu/Deep-Reinforcement-Learning-Algorithms-with-PyTorch
PyTorch implementations of deep reinforcement learning algorithms and environments
Language:Python1 3 00
zanghyu/Offline_Bisimulation
Official implementation of Understanding and Addressing the Pitfalls of Bisimulation-based Representations in Offline Reinforcement Learning
Language:Python1 2 00
zanghyu/RL_note
Language:HTML1 3 00
zanghyu/RLcode
Language:Python1 3 00
zanghyu/resources
some resources about RL, ML
0 4 00
zanghyu/zanghyu.github.io
Github Pages for academic personal websites
Language:JavaScript0 1 00
zanghyu/blog
Everything about database,bussiness.(Most for PostgreSQL).
Language:PLpgSQL2 0
zanghyu/DGI
Add data preprocessing script in this code.
Language:Python3 0
zanghyu/dqn-tetris
Language:Python3 0
zanghyu/facechain
FaceChain is a deep-learning toolchain for generating your Digital-Twin.
Language:Python1 0
zanghyu/fairseq
Facebook AI Research Sequence-to-Sequence Toolkit written in Python.
Language:Python3 0
zanghyu/guacamol_baselines
Baselines models for GuacaMol benchmarks
Language:Python2 0
zanghyu/ImageReward
ImageReward: Learning and Evaluating Human Preferences for Text-to-image Generation
Language:Python1 0
zanghyu/K-FAC-example
Language:Python3 01
zanghyu/Love-1
Language:Python3 0
zanghyu/nn_builder
Build neural networks with less boilerplate code
Language:Python2 0
zanghyu/offline_rl_envs
Implementations of Gridworld, Modelwin, and Modelfail to experiment with offline RL
Language:Python2 0
zanghyu/ORGANIC
Code repo for optimizing distributions of molecules.
Language:Jupyter Notebook2 0
zanghyu/python_plot
Language:Python3 0
zanghyu/python_trick
3 0
zanghyu/pytorch-seq2seq
An open source framework for seq2seq models in PyTorch.
Language:Python4 0
zanghyu/query_phone_number
手机号码归属地查询
Language:Python2 01
zanghyu/RL100questions
QA about reinforcement learning
3 0
zanghyu/seqmnist
Language:Python4 0
zanghyu/stable-baselines
Mirror of Stable-Baselines: a fork of OpenAI Baselines, implementations of reinforcement learning algorithms
Language:Python2 0
zanghyu/tf_project_templete
This is a simple templete of tensorflow project
Language:Python3 0
zanghyu/TMAP
TMAP: Integrating Trust Region and Maximum Entropy with Augmented Bellman Equation for Policy Optimization
Language:Python3 0
zanghyu/toolkit
this is a python toolkit for personal use
Language:Python3 0
zanghyu/visualkit
visualization for rl
Language:Python2 0