DavidWang527

DavidWang527's Stars

huggingface/transformers
🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.
Language:Python134k 1.1k 15.9k26.7k
sdmg15/Best-websites-a-programmer-should-visit
:link: Some useful websites for programmers.
61.4k 1.4k 1627.7k
microsoft/DeepSpeed
DeepSpeed is a deep learning optimization library that makes distributed training and inference easy, efficient, and effective.
Language:Python35.1k 343 2.8k4.1k
yoheinakajima/babyagi
Language:Python20.2k 299 1512.6k
kenjihiranabe/The-Art-of-Linear-Algebra
Graphic notes on Gilbert Strang's "Linear Algebra for Everyone"
Language:PostScript17.9k 147 142.2k
dair-ai/ml-visuals
🎨 ML Visuals contains figures and templates which you can reuse and customize to improve your scientific writing.
13.4k 115 491.4k
tuteng/Best-websites-a-programmer-should-visit-zh
程序员应该访问的最佳网站中文版
11.4k 248 111.4k
FMInference/FlexGen
Running large language models on a single GPU for throughput-oriented scenarios.
Language:Python9.1k 111 81540
PKU-YuanGroup/ChatLaw
ChatLaw：A Powerful LLM Tailored for Chinese Legal. 中文法律大模型
6.9k 38 74543
rtqichen/torchdiffeq
Differentiable ODE solvers with full GPU support and O(1)-memory backpropagation.
Language:Python5.5k 125 217919
circlestarzero/EX-chatGPT
Let ChatGPT truly learn how to go online and call APIs! 'EX-ChatGPT' can rival and even surpass NewBing
Language:Python2k 14 67332
openai/multi-agent-emergence-environments
Environment generation code for the paper "Emergent Tool Use From Multi-Agent Autocurricula"
Language:Python1.6k 187 31306
ORDINAND/The-Art-of-Asking-ChatGPT-for-High-Quality-Answers-A-complete-Guide-to-Prompt-Engineering-Technique
ChatGPT提问技巧
982 9 0120
Replicable-MARL/MARLlib
One repository is all that is necessary for Multi-agent Reinforcement Learning (MARL)
Language:Python906 10 154145
XinJingHao/Deep-Reinforcement-Learning-Algorithms-with-Pytorch
Clean, Robust, and Unified PyTorch implementation of popular DRL Algorithms (Q-learning, Duel DDQN, PER, C51, Noisy DQN, PPO, DDPG, TD3, SAC, ASL)
Language:Python900 7 7103
Bigpig4396/Multi-Agent-Reinforcement-Learning-Environment
Hello, I pushed some python environments for Multi Agent Reinforcement Learning.
Language:Python666 9 7124
eleurent/rl-agents
Implementations of Reinforcement Learning and Planning algorithms
Language:Python585 19 101152
shifujun/UESTCthesis
电子科技大学毕设设计论文LaTeX模板
Language:TeX582 24 111163
uoe-agents/epymarl
An extension of the PyMARL codebase that includes additional algorithms and environment support
Language:Python488 7 59136
floodsung/LLM-with-RL-papers
A collection of LLM with RL papers
225 8 39
kaixindelele/ChatOpenReview
Crowdfunding open source projects: use OpenReview's high-quality review data to fine-tune a professional review and response LLM. 众筹开源项目：利用OpenReview的优质审稿数据，微调出一个专业的审稿和审稿回复GPT
Language:Python197 9 012
binary-husky/unreal-map
Multiagent research environment toolbox based on Unreal Engine
Language:Python192 5 1033
hzeyuan/OpenGPTS
OpenGPTs- Powerful GPTs Colipot | 强大的gpts浏览器插件|多窗口|批量对话|chatgpt3.5|chatgpt4.0
Language:TypeScript178 1 712
binary-husky/hmp2g
Multiagent Reinforcement Learning Research Project
Language:Python113 4 734
sumitsk/marl_transfer
Code for paper 'Learning transferable cooperative behaviors in multi-agent teams' (ICML 2019)
Language:Python107 6 531
BIT-aerial-robotics/AquaML
Language:Python97 2 110
binary-husky/ChatPaper
Use ChatGPT to summarize the arXiv papers. 全流程加速科研，利用chatgpt进行论文总结+润色+审稿+审稿回复
Language:Python46 1 09
Haichao-Zhang/PEX
Policy Expansion for Bridging Offline-to-Online Reinforcement Learning (ICLR23)
Language:Python45 3 35
oxwhirl/comix
Language:Python40 4 1211
binary-husky/Chinese-ChatLLaMA
中文LLaMA基础模型；中文ChatLLaMA对话模型；NLP预训练/指令微调数据集
Language:Python2 1 00

DavidWang527

DavidWang527's Stars

huggingface/transformers

sdmg15/Best-websites-a-programmer-should-visit

microsoft/DeepSpeed

yoheinakajima/babyagi

kenjihiranabe/The-Art-of-Linear-Algebra

dair-ai/ml-visuals

tuteng/Best-websites-a-programmer-should-visit-zh

FMInference/FlexGen

PKU-YuanGroup/ChatLaw

rtqichen/torchdiffeq

circlestarzero/EX-chatGPT

openai/multi-agent-emergence-environments

ORDINAND/The-Art-of-Asking-ChatGPT-for-High-Quality-Answers-A-complete-Guide-to-Prompt-Engineering-Technique

Replicable-MARL/MARLlib

XinJingHao/Deep-Reinforcement-Learning-Algorithms-with-Pytorch

Bigpig4396/Multi-Agent-Reinforcement-Learning-Environment

eleurent/rl-agents

shifujun/UESTCthesis

uoe-agents/epymarl

floodsung/LLM-with-RL-papers

kaixindelele/ChatOpenReview

binary-husky/unreal-map

hzeyuan/OpenGPTS

binary-husky/hmp2g

sumitsk/marl_transfer

BIT-aerial-robotics/AquaML

binary-husky/ChatPaper

Haichao-Zhang/PEX

oxwhirl/comix

binary-husky/Chinese-ChatLLaMA