policy-gradient

There are 436 repositories under policy-gradient topic.

datawhalechina/easy-rl
强化学习中文教程（蘑菇书🍄），在线阅读地址：https://datawhalechina.github.io/easy-rl/
Language:Jupyter Notebook12.4k 86 1602.1k
MorvanZhou/Reinforcement-learning-with-tensorflow
Simple Reinforcement learning tutorials, 莫烦Python 中文AI教学
Language:Python9.3k 291 1955k
thu-ml/tianshou
An elegant PyTorch deep reinforcement learning library.
Language:Python8.8k 92 7711.2k
sweetice/Deep-reinforcement-learning-with-pytorch
PyTorch implementation of DQN, AC, ACER, A2C, A3C, PG, DDPG, TRPO, PPO, SAC, TD3 and ....
Language:Python4.4k 35 35890
rlcode/reinforcement-learning
Minimal and Clean Reinforcement Learning Examples
Language:Python3.6k 127 54739
nikhilbarhate99/PPO-PyTorch
Minimal implementation of clipped objective Proximal Policy Optimization (PPO) in PyTorch
Language:Python2.2k 6 62398
kengz/SLM-Lab
Modular Deep Reinforcement Learning framework in PyTorch. Companion library of the book "Foundations of Deep Reinforcement Learning".
Language:Python1.3k 46 72277
Khrylx/PyTorch-RL
PyTorch implementation of Deep Reinforcement Learning: Policy Gradient methods (TRPO, PPO, A2C) and Generative Adversarial Imitation Learning (GAIL). Fast Fisher vector product TRPO.
Language:Python1.2k 26 37190
Kismuz/btgym
Scalable, event-driven, deep-learning-friendly backtesting library
Language:Python1k 99 130259
sudharsan13296/Hands-On-Reinforcement-Learning-With-Python
Master Reinforcement and Deep Reinforcement Learning using OpenAI Gym and TensorFlow
Language:Jupyter Notebook858 43 3325
yaserkl/RLSeq2Seq
Deep Reinforcement Learning For Sequence to Sequence Models
Language:Python768 27 32163
omerbsezer/Reinforcement_learning_tutorial_with_demo
Reinforcement Learning Tutorial with Demo: DP (Policy and Value Iteration), Monte Carlo, TD Learning (SARSA, QLearning), Function Approximation, Policy Gradient, DQN, Imitation, Meta Learning, Papers, Courses, etc..
Language:Jupyter Notebook766 25 0174
benedekrozemberczki/awesome-monte-carlo-tree-search-papers
A curated list of Monte Carlo tree search papers with implementations.
Language:Python686 29 476
suragnair/seqGAN
A simplified PyTorch implementation of "SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient." (Yu, Lantao, et al.)
Language:Python647 13 24149
germain-hug/Deep-RL-Keras
Keras Implementation of popular Deep RL Algorithms (A3C, DDQN, DDPG, Dueling DDQN)
Language:Python545 24 31148
theamrzaki/text_summurization_abstractive_methods
Multiple implementations for abstractive text summurization , using google colab
Language:Jupyter Notebook526 9 22219
medipixel/rl_algorithms
Structural implementation of RL key algorithms
Language:Python514 11 10064
yukezhu/tensorflow-reinforce
Implementations of Reinforcement Learning Models in Tensorflow
Language:Python487 21 8135
VinF/deer
DEEp Reinforcement learning framework
Language:Python484 50 32123
navneet-nmk/pytorch-rl
This repository contains model-free deep reinforcement learning algorithms implemented in Pytorch
Language:Python447 23 355
sudharsan13296/Deep-Reinforcement-Learning-With-Python
Master classic RL, deep RL, distributional RL, inverse RL, and more using OpenAI Gym and TensorFlow with extensive Math
Language:Jupyter Notebook436 10 0136
pythonlessons/Reinforcement_Learning
Reinforcement learning tutorials
Language:Python388 6 6155
rlcode/reinforcement-learning-kr
[파이썬과 케라스로 배우는 강화학습] 예제
Language:Python384 33 42230
zuoxingdong/lagom
lagom: A PyTorch infrastructure for rapid prototyping of reinforcement learning algorithms.
Language:Jupyter Notebook377 15 8230
pat-coady/trpo
Trust Region Policy Optimization with TensorFlow and OpenAI Gym
Language:Jupyter Notebook362 16 32105
RITCHIEHuang/DeepRL_Algorithms
DeepRL algorithms implementation easy for understanding and reading with Pytorch and Tensorflow 2(DQN, REINFORCE, VPG, A2C, TRPO, PPO, DDPG, TD3, SAC)
Language:Python341 10 1539
Allenpandas/Reinforcement-Learning-Papers
📚 List of Top-tier Conference Papers on Reinforcement Learning (RL)，including: NeurIPS, ICML, AAAI, IJCAI, AAMAS, ICLR, ICRA, etc.
336 13 334
kengz/openai_lab
An experimentation framework for Reinforcement Learning using OpenAI Gym, Tensorflow, and Keras.
Language:Python327 32 368
salesforce/MultiHopKG
Multi-hop knowledge graph reasoning learned via policy gradient with reward shaping and action dropout
Language:Jupyter Notebook309 14 2980
DeNA/HandyRL
HandyRL is a handy and simple framework based on Python and PyTorch for distributed reinforcement learning that is applicable to your own environments.
Language:Python287 12 2443
bentrevett/pytorch-rl
Tutorials for reinforcement learning in PyTorch and Gym by implementing a few of the popular algorithms. [IN PROGRESS]
Language:Jupyter Notebook285 7 476
LiamConnell/deep-algotrading
A resource for learning about deep learning techniques from regression to LSTM and Reinforcement Learning using financial data and the fitness functions of algorithmic trading
Language:Jupyter Notebook236 19 075
MarcoMeter/episodic-transformer-memory-ppo
Clean baseline implementation of PPO using an episodic TransformerXL memory
Language:Python187 3 1422
Rintarooo/VRP_DRL_MHA
"Attention, Learn to Solve Routing Problems!"[Kool+, 2019], Capacitated Vehicle Routing Problem solver
Language:Python185 2 038
MG2033/A2C
A Clearer and Simpler Synchronous Advantage Actor Critic (A2C) Implementation in TensorFlow
Language:Python182 7 1336
liziniu/ReMax
Code for Paper (ReMax: A Simple, Efficient and Effective Reinforcement Learning Method for Aligning Large Language Models)
Language:Python181 2 513

policy-gradient

datawhalechina/easy-rl

MorvanZhou/Reinforcement-learning-with-tensorflow

thu-ml/tianshou

sweetice/Deep-reinforcement-learning-with-pytorch

rlcode/reinforcement-learning

nikhilbarhate99/PPO-PyTorch

kengz/SLM-Lab

Khrylx/PyTorch-RL

Kismuz/btgym

sudharsan13296/Hands-On-Reinforcement-Learning-With-Python

yaserkl/RLSeq2Seq

omerbsezer/Reinforcement_learning_tutorial_with_demo

benedekrozemberczki/awesome-monte-carlo-tree-search-papers

suragnair/seqGAN

germain-hug/Deep-RL-Keras

theamrzaki/text_summurization_abstractive_methods

medipixel/rl_algorithms

yukezhu/tensorflow-reinforce

VinF/deer

navneet-nmk/pytorch-rl

sudharsan13296/Deep-Reinforcement-Learning-With-Python

pythonlessons/Reinforcement_Learning

rlcode/reinforcement-learning-kr

zuoxingdong/lagom

pat-coady/trpo

RITCHIEHuang/DeepRL_Algorithms

Allenpandas/Reinforcement-Learning-Papers

kengz/openai_lab

salesforce/MultiHopKG

DeNA/HandyRL

bentrevett/pytorch-rl

LiamConnell/deep-algotrading

MarcoMeter/episodic-transformer-memory-ppo

Rintarooo/VRP_DRL_MHA

MG2033/A2C

liziniu/ReMax