KonoeSubaru

KonoeSubaru's Stars

PKU-MARL/HARL
Official implementation of HARL algorithms based on PyTorch.
Language:Python48157
LiSir-HIT/Reinforcement-Learning
kinds of reinforcement learning model by Pytorch
Language:Python25461
intelligent-environments-lab/CityLearn
Official reinforcement learning environment for demand response and load shaping
Language:Python470171
HansenHua/MFPO-INFOCOM24
An online federated reinforcement learning algorithm published in INFOCOM2024
Language:Python121
DesikRengarajan/FEDORA
[NeurIPS 2024] Code for Federated Ensemble-Directed Offline Reinforcement Learning
Language:Python203
qiongwu86/Edge-Caching-Based-on-Multi-Agent-Deep-Reinforcement-Learning-and-Federated-Learning
Language:Python467
microsoft/HuRL
Code repository accompanying the Heuristic Guided RL NeurIPS'21 paper
Language:Python123
Alirezad126/PD-DDPGfD
Code for Primal-Dual Deep Deterministic Policy Gradient From Demonstrations
Language:PostScript41
akjayant/PPO_Lagrangian_PyTorch
Implementation of PPO Lagrangian in PyTorch
Language:Python3410
openai/safety-starter-agents
Basic constrained RL agents used in experiments for the "Benchmarking Safe Exploration in Deep Reinforcement Learning" paper.
Language:Python391113
chauncygu/Multi-Agent-Constrained-Policy-Optimisation
Multi-Agent Constrained Policy Optimisation (MACPO; MAPPO-L).
Language:Python14324
tayalmanan28/Safe_Reinforcement_Learning
Repository containing the code for the paper "Safe Model-Based Reinforcement Learning using Robust Control Barrier Functions". Specifically, an implementation of SAC + Robust Control Barrier Functions (RCBFs) for safe reinforcement learning in two custom environments
Language:Python346
ammarhydr/SAC-Lagrangian
PyTorch implementation of Constrained Reinforcement Learning for Soft Actor Critic Algorithm
Language:Python307
PKU-Alignment/omnisafe
JMLR: OmniSafe is an infrastructural framework for accelerating SafeRL research.
Language:Python920132
PKU-Alignment/safety-gymnasium
NeurIPS 2023: Safety-Gymnasium: A Unified Safe Reinforcement Learning Benchmark
Language:Python38453
snu-mllab/DPPO
Official implementation of "Direct Preference-based Policy Optimization without Reward Modeling" (NeurIPS 2023)
Language:Python371
david-lindner/idrl
Code accompanying the paper "Information Directed Reward Learning for Reinforcement Learning" (NeurIPS 2021).
Language:Python132
PKU-Alignment/Safe-Policy-Optimization
NeurIPS 2023: Safe Policy Optimization: A benchmark repository for safe reinforcement learning algorithms
Language:Python32245
LucasCJYSDL/HierAIRL
A novel Hierarchical Imitation Learning algorithm based on AIRL.
Language:Python181
FederatedAI/FATE
An Industrial Grade Federated Learning Framework
Language:Python5.7k1.6k
Jordan-Haidee/FedDDPG
Language:Python1
wangyu92/cartpole-ppo-federated-learning
Language:Python3
tensorlayer/TensorLayer
Deep Learning and Reinforcement Learning Library for Scientists and Engineers
Language:Python7.3k1.6k
yumath/bertNER
ChineseNER based on BERT, with BiLSTM+CRF layer
Language:Python43797

KonoeSubaru

KonoeSubaru's Stars

PKU-MARL/HARL

LiSir-HIT/Reinforcement-Learning

intelligent-environments-lab/CityLearn

HansenHua/MFPO-INFOCOM24

DesikRengarajan/FEDORA

qiongwu86/Edge-Caching-Based-on-Multi-Agent-Deep-Reinforcement-Learning-and-Federated-Learning

microsoft/HuRL

Alirezad126/PD-DDPGfD

akjayant/PPO_Lagrangian_PyTorch

openai/safety-starter-agents

chauncygu/Multi-Agent-Constrained-Policy-Optimisation

tayalmanan28/Safe_Reinforcement_Learning

ammarhydr/SAC-Lagrangian

PKU-Alignment/omnisafe

PKU-Alignment/safety-gymnasium

snu-mllab/DPPO

david-lindner/idrl

PKU-Alignment/Safe-Policy-Optimization

LucasCJYSDL/HierAIRL

FederatedAI/FATE

Jordan-Haidee/FedDDPG

wangyu92/cartpole-ppo-federated-learning

tensorlayer/TensorLayer

yumath/bertNER