PaParaZz1

CV is over. RL is running. What's next?

@opendilab Shenzhen, China

Pinned Repositories

DI-engine
OpenDILab Decision AI Engine. The Most Comprehensive Reinforcement Learning Framework B.P.
Language:Python3.1k 22 205374
DI-sheep
羊了个羊 + 深度强化学习（Deep Reinforcement Learning + 3 Tiles Game)
Language:Python432 4 325
DI-star
An artificial intelligence platform for the StarCraft II with large-scale distributed training and grand-master agents.
Language:Python1.2k 19 26115
LightZero
[NeurIPS 2023 Spotlight] LightZero: A Unified Benchmark for Monte Carlo Tree Search in General Sequential Decision Scenarios (awesome MCTS)
Language:Python1.2k 13 106120
PPOxFamily
PPO x Family DRL Tutorial Course（决策智能入门级公开课：8节课帮你盘清算法理论，理顺代码逻辑，玩转决策AI应用实践）
Language:Python2k 16 17179
PsyDI
PsyDI: Towards a Personalized and Progressively In-depth Chatbot for Psychological Measurements. (e.g. MBTI Measurement Agent)
Language:TypeScript149 4 515
CARAFE_pytorch
naive CARAFE implementation in Pytorch
Language:Python9 1 01
CariGANs
pytorch implementation for CariGANS
Language:Python34 2 25
DI-sheep
Language:Python14 1 03
TP-GAN
pytorch implemention for TP-GAN
Language:Python9 1 30

PaParaZz1's Repositories

PaParaZz1/annonated_code_viz
Language:JavaScript3 1 0
PaParaZz1/awesome-decision-transformer
A curated list of Decision Transformer resources (continually updated)
2
PaParaZz1/DI-card
Language:Python1 1 03
PaParaZz1/fastapi-weibo
Language:Python11
PaParaZz1/ML-tutorial
Language:Jupyter Notebook1 1 02
PaParaZz1/PPOxFamily
PPO x Family DRL Tutorial Course（决策智能入门级公开课：8节课帮你盘清算法理论，理顺代码逻辑，玩转决策AI应用实践）
Language:Python1 0 0
PaParaZz1/awesome-RLHF
A curated list of reinforcement learning with human feedback resources (continually updated)
0 0
PaParaZz1/CleanS2S
High-quality and streaming Speech-to-Speech interactive agent in a single file. 只用一个文件实现的流式全双工语音交互原型智能体！
PaParaZz1/CodeMorpheus
CodeMorpheus: Generate code self-portraits with one click（一键生成代码自画像，决策型 AI + 生成式 AI）
Language:Python0 0
PaParaZz1/csharp_practice
Language:C#1 01
PaParaZz1/D4RL
A collection of reference environments for offline reinforcement learning
Language:Python0 0
PaParaZz1/data_generation
Language:Python
PaParaZz1/diffuser
Code for the paper "Planning with Diffusion for Flexible Behavior Synthesis"
Language:Python0 0
PaParaZz1/dmc2gym
OpenAI Gym wrapper for the DeepMind Control Suite
Language:Python
PaParaZz1/ds_comm_bench
Language:Python0 0
PaParaZz1/empathic-voice-interface-starter
Language:TypeScript
PaParaZz1/evogym
A large-scale benchmark for co-optimizing the design and control of soft robots, as seen in NeurIPS 2021.
Language:Python0 0
PaParaZz1/fastapi-vercel
A FastAPI example app deployed on Vercel
PaParaZz1/GenerativeRL
Python library for solving reinforcement learning (RL) problems using generative models (e.g. Diffusion Models).
Language:Python0 0
PaParaZz1/genius-invokation-gym
原神七圣召唤模拟环境 Simulator of Genius Invocation
Language:Python0 0
PaParaZz1/LightZero
LightZero: A lightweight and efficient MCTS/AlphaZero/MuZero algorithm toolkit.
Language:Python0 0
PaParaZz1/LLMRiddles
Open-Source Reproduction/Demo of the LLM Riddles Game
Language:Python0 0
PaParaZz1/nanoGPT
The simplest, fastest repository for training/finetuning medium-sized GPTs.
Language:Python0 0
PaParaZz1/nextjs-dashboard
Language:TypeScript
PaParaZz1/OpenAOE
LLM Group Chat Framework: chat with multiple LLMs at the same time. 大模型群聊框架：同时与多个大语言模型聊天。
Language:TypeScript
PaParaZz1/PsyDI
Language:TypeScript1 0
PaParaZz1/rag_examples
Language:Python1 0
PaParaZz1/SO2
[AAAI2024] A Perspective of Q-value Estimation on Offline-to-Online Reinforcement Learning
0 0
PaParaZz1/tbdata
Language:C++2 0
PaParaZz1/tracing
Language:Python1 0