Xiangxiangzhu

FRIEREN KNIGHT

Pinned Repositories

EVCS-rollling-opt
Language:Python0 1 00
general-tls
general traffic light agent
Language:Python0 1 00
LLaMA-Efficient-Tuning
Easy-to-use LLM fine-tuning framework (LLaMA-2, BLOOM, Falcon, Baichuan, Qwen, ChatGLM2)
Language:Python0 0 00
LLM-EasyDeploy
We decide to construct a lightweight, scalable platform from scratch for deploying LLM and MLLM large models.
00
tzm-vllm
A high-throughput and memory-efficient inference and serving engine for LLMs
Language:Python10
UC-using-pulp
Modelling Unit Commitment Problem as a MIP problem, using pulp package and cplex(or gurobi) to solve it.
Language:Python4 1 00
Xiangxiangzhu.github.io
Github Pages template for academic personal websites, forked from mmistakes/minimal-mistakes
Language:JavaScript0 0 00
charginghub-env
Code for the charginghub environment used in our paper "__"
Language:C++0 1 01
all-in-one-llm
Deployment a light and full OpenAI API for production
Language:Python30
ZhongjiaoGPT
AI power road design (under dev)
Language:Python40

Xiangxiangzhu's Repositories

Xiangxiangzhu/UC-using-pulp
Modelling Unit Commitment Problem as a MIP problem, using pulp package and cplex(or gurobi) to solve it.
Language:Python4 1 00
Xiangxiangzhu/tzm-vllm
A high-throughput and memory-efficient inference and serving engine for LLMs
Language:Python10
Xiangxiangzhu/EVCS-rollling-opt
Language:Python0 1 00
Xiangxiangzhu/general-tls
general traffic light agent
Language:Python0 1 00
Xiangxiangzhu/LLaMA-Efficient-Tuning
Easy-to-use LLM fine-tuning framework (LLaMA-2, BLOOM, Falcon, Baichuan, Qwen, ChatGLM2)
Language:Python0 0 00
Xiangxiangzhu/LLM-EasyDeploy
We decide to construct a lightweight, scalable platform from scratch for deploying LLM and MLLM large models.
00
Xiangxiangzhu/LLM-inference
00
Xiangxiangzhu/mldm_temp
Language:Python0 1 00
Xiangxiangzhu/PARL
A high-performance distributed training framework for Reinforcement Learning
Language:Python00
Xiangxiangzhu/safe-rlhf
Safe-RLHF: Constrained Value Alignment via Safe Reinforcement Learning from Human Feedback
Language:Python0 0 00
Xiangxiangzhu/Xiangxiangzhu.github.io
Github Pages template for academic personal websites, forked from mmistakes/minimal-mistakes
Language:JavaScript0 0 00
Xiangxiangzhu/proc-tensorflow-tls
distributed learning and simulation using tensorflow for general traffic light agent
Language:Python1 0
Xiangxiangzhu/rqwrwq
Xiangxiangzhu/safe-explorer
Pytorch implementation of "Safe Exploration in Continuous Action Spaces" [Dalal et al.]
Xiangxiangzhu/safety-starter-agents
Basic constrained RL agents used in experiments for the "Benchmarking Safe Exploration in Deep Reinforcement Learning" paper.
Language:Python0 0
Xiangxiangzhu/sumo_net
1 0
Xiangxiangzhu/sumolights
SUMO adaptive traffic signal control - DQN, DDPG, Webster's, Max-pressure, Self-Organizing Traffic Lights
Xiangxiangzhu/test_lag_theory
Language:Python1 0
Xiangxiangzhu/test_tt_theory
Language:Python
Xiangxiangzhu/TrafficGPT
Language:Python0 0

Xiangxiangzhu

Pinned Repositories

EVCS-rollling-opt

general-tls

LLaMA-Efficient-Tuning

LLM-EasyDeploy

tzm-vllm

UC-using-pulp

Xiangxiangzhu.github.io

charginghub-env

all-in-one-llm

ZhongjiaoGPT

Xiangxiangzhu's Repositories

Xiangxiangzhu/UC-using-pulp

Xiangxiangzhu/tzm-vllm

Xiangxiangzhu/EVCS-rollling-opt

Xiangxiangzhu/general-tls

Xiangxiangzhu/LLaMA-Efficient-Tuning

Xiangxiangzhu/LLM-EasyDeploy

Xiangxiangzhu/LLM-inference

Xiangxiangzhu/mldm_temp

Xiangxiangzhu/PARL

Xiangxiangzhu/safe-rlhf

Xiangxiangzhu/Xiangxiangzhu.github.io

Xiangxiangzhu/proc-tensorflow-tls

Xiangxiangzhu/rqwrwq

Xiangxiangzhu/safe-explorer

Xiangxiangzhu/safety-starter-agents

Xiangxiangzhu/sumo_net

Xiangxiangzhu/sumolights

Xiangxiangzhu/test_lag_theory

Xiangxiangzhu/test_tt_theory

Xiangxiangzhu/TrafficGPT