StepNeverStop

Ph.D. candidate at Lamda 5 group in Nanjing University. My research interest is deep reinforcement learning.

Nanjing UniversityNan Jing

Pinned Repositories

acme
A library of reinforcement learning components and agents
Language:Python1 2 00
ConnectSix
Connect six environment training for AI Bot
Language:Python5 4 01
DeepLearningMethods
Crawl deep learning methods from https://paperswithcode.com/methods
Language:Python8 2 00
RL-TF1
Reinforcement learning algorithms implemented based on tensorflow 1.x
Language:Python5 3 02
RLs
Reinforcement Learning Algorithms Based on PyTorch
Language:Python447 18 4893
RLwithUnity
Reinforcement Leanring Algorithms Trained with Unity
Language:Python14 3 00
Staged-Experience-Mechanism
Code of `Staged Experience Mechanism (SEM)`
Language:Python2 2 00
StepNeverStop.github.io
Language:HTML5 3 11
TF2-RL
Reinforcement learning algorithms implemented for Tensorflow 2.0+ [DQN, DDPG, AE-DDPG, SAC, PPO]
Language:Python2 2 02
UnityEnvs
Reinforcement Learning Environments with ML-Agents.
Language:C#6 3 00

StepNeverStop's Repositories

StepNeverStop/RLs
Reinforcement Learning Algorithms Based on PyTorch
Language:Python447 18 4893
StepNeverStop/DeepLearningMethods
Crawl deep learning methods from https://paperswithcode.com/methods
Language:Python8 2 00
StepNeverStop/UnityEnvs
Reinforcement Learning Environments with ML-Agents.
Language:C#6 3 00
StepNeverStop/RL-TF1
Reinforcement learning algorithms implemented based on tensorflow 1.x
Language:Python5 3 02
StepNeverStop/StepNeverStop.github.io
Language:HTML5 3 11
StepNeverStop/Staged-Experience-Mechanism
Code of `Staged Experience Mechanism (SEM)`
Language:Python2 2 00
StepNeverStop/TF2-RL
Reinforcement learning algorithms implemented for Tensorflow 2.0+ [DQN, DDPG, AE-DDPG, SAC, PPO]
Language:Python2 2 02
StepNeverStop/acme
A library of reinforcement learning components and agents
Language:Python1 2 00
StepNeverStop/Advanced-Soft-Actor-Critic
Soft Actor-Critic with advanced features
Language:Python1 1 0
StepNeverStop/Deep-Reinforcement-Learning-Algorithms
25 projects in the framework of Deep Reinforcement Learning algorithms: DQN, PPO, DDPG, TD3, SAC, A2C and others. Each project is provided with a detailed training log.
Language:Jupyter Notebook1 1 0
StepNeverStop/StepNeverStop
1 1 01
StepNeverStop/CleanDiffuser
CleanDiffuser: An Easy-to-use Modularized Library for Diffusion Models in Decision Making
Language:Jupyter Notebook0 0
StepNeverStop/coach
Reinforcement Learning Coach by Intel AI Lab enables easy experimentation with state of the art Reinforcement Learning algorithms
Language:Python2 0
StepNeverStop/d3rlpy
An offline deep reinforcement learning library
StepNeverStop/d4rl-pybullet
Datasets for Data-Driven Deep Reinforcement Learning with Pybullet environments
Language:Python1 0
StepNeverStop/DeepRL
Deep Reinforcement Learning Lab, a platform designed to make DRL technology and fun for everyone
1 01
StepNeverStop/garage
A toolkit for reproducible reinforcement learning research
Language:Python1 0
StepNeverStop/gym-collision-avoidance
Language:OpenEdge ABL2 0
StepNeverStop/highway-env
A minimalist environment for decision-making in autonomous driving
Language:Python1 0
StepNeverStop/JARVIS
JARVIS, a system to connect LLMs with ML community
Language:Python1 0
StepNeverStop/LAMDA-Beamer-Template
A beamer template for LAMDA lab at NJU
Language:TeX1 0
StepNeverStop/leeml-notes
李宏毅《机器学习》笔记，在线阅读地址：https://datawhalechina.github.io/leeml-notes
1 01
StepNeverStop/machin
Reinforcement learning library designed for PyTorch, implements DQN, DDPG, A2C, PPO, SAC, MADDPG, A3C, APEX, IMPALA ...
Language:Python2 0
StepNeverStop/NJU-health-report
用于在 GitHub Actoin 上部署南京大学每日健康填报自动打卡脚本
Language:Python1 01
StepNeverStop/off-dynamics-rl
StepNeverStop/planet
Learning Latent Dynamics for Planning from Pixels
Language:Python2 0
StepNeverStop/SHU-selfreport
上海大学每日一报挂机自动打卡
Language:Python1 0
StepNeverStop/shuthesis
LaTeX Thesis Template for Shanghai University
Language:TeX1 0
StepNeverStop/unstable_baselines
Re-implementations of SOTA RL algorithms.
Language:Python1 0
StepNeverStop/xingtian
xingtian is a componentized library for the development and verification of reinforcement learning algorithms
Language:Python1 0