zmsn-2077

Ph.D. student at Peking University. Interested in Coding & LLM (Safe) Alignment, @PKU-Alignment.

Peking University, Beijing

Pinned Repositories

omnisafe
JMLR: OmniSafe is an infrastructural framework for accelerating SafeRL research.
Language:Python912 38 103130
Safe-Policy-Optimization
NeurIPS 2023: Safe Policy Optimization: A benchmark repository for safe reinforcement learning algorithms
Language:Python322 7 1045
safe-rlhf
Safe RLHF: Constrained Value Alignment via Safe Reinforcement Learning from Human Feedback
Language:Python1.3k 18 84119
DexterousHands
This is a library that provides dual dexterous hand manipulation tasks through Isaac Gym
Language:Python627 13 4174
align-anything
Align Anything: Training All-modality Model with Feedback
Language:Python00
CUP-safe-rl
NeurIPS2022: Constrained Update Projection Approach to Safe Policy Optimization
Language:Python11 1 12
Dev-Setup-Jiaming
Automation scripts for setting up a basic development environment.
Language:Shell1 0 00
omnisafe_zmsn
OmniSafe is a comprehensive and reliable benchmark for safe reinforcement learning.
Language:Python1 0 00
RLHFTest
1 1 00
Safe-Policy-Optimization
This is a benchmark repository for safe reinforcement learning algorithms
Language:Python1 0 00

zmsn-2077's Repositories

zmsn-2077/CUP-safe-rl
NeurIPS2022: Constrained Update Projection Approach to Safe Policy Optimization
Language:Python11 1 12
zmsn-2077/Dev-Setup-Jiaming
Automation scripts for setting up a basic development environment.
Language:Shell1 0 00
zmsn-2077/omnisafe_zmsn
OmniSafe is a comprehensive and reliable benchmark for safe reinforcement learning.
Language:Python1 0 00
zmsn-2077/RLHFTest
1 1 00
zmsn-2077/Safe-Policy-Optimization
This is a benchmark repository for safe reinforcement learning algorithms
Language:Python1 0 00
zmsn-2077/align-anything
Align Anything: Training All-modality Model with Feedback
Language:Python00
zmsn-2077/baichuan-7B
A large-scale 7B pretraining language model developed by Baichuan
Language:Python0 0 00
zmsn-2077/draggable-example
vue.draggable example
Language:Vue0 0 00
zmsn-2077/functorch
functorch is JAX-like composable function transforms for PyTorch.
Language:Jupyter Notebook0 0 00
zmsn-2077/Gymnasium
A standard API for single-agent reinforcement learning environments, with popular reference environments and related utilities (formerly Gym)
Language:Python0 0 00
zmsn-2077/RRHF
RRHF & Wombat
Language:Python0 0
zmsn-2077/safe-rlhf-dev
Safe RLHF: Constrained Value Alignment via Safe Reinforcement Learning from Human Feedback
Language:Python0 0
zmsn-2077/safety-gymnasium-zmsn
Safety-Gymnaisum is a highly scalable and customizable safe reinforcement learning environment library.
Language:Python0 0
zmsn-2077/stable-baselines3
PyTorch version of Stable Baselines, reliable implementations of reinforcement learning algorithms.
Language:Python0 0
zmsn-2077/starter-hugo-research-group
Language:TeX2 0
zmsn-2077/tianshou
An elegant PyTorch deep reinforcement learning library.
Language:Python0 0
zmsn-2077/tldr
📚 Collaborative cheatsheets for console commands
zmsn-2077/torchopt
TorchOpt is an efficient library for differentiable optimization built upon PyTorch.

zmsn-2077

Pinned Repositories

omnisafe

Safe-Policy-Optimization

safe-rlhf

DexterousHands

align-anything

CUP-safe-rl

Dev-Setup-Jiaming

omnisafe_zmsn

RLHFTest

Safe-Policy-Optimization

zmsn-2077's Repositories

zmsn-2077/CUP-safe-rl

zmsn-2077/Dev-Setup-Jiaming

zmsn-2077/omnisafe_zmsn

zmsn-2077/RLHFTest

zmsn-2077/Safe-Policy-Optimization

zmsn-2077/align-anything

zmsn-2077/baichuan-7B

zmsn-2077/draggable-example

zmsn-2077/functorch

zmsn-2077/Gymnasium

zmsn-2077/RRHF

zmsn-2077/safe-rlhf-dev

zmsn-2077/safety-gymnasium-zmsn

zmsn-2077/stable-baselines3

zmsn-2077/starter-hugo-research-group

zmsn-2077/tianshou

zmsn-2077/tldr

zmsn-2077/torchopt