yangulei

Deep Learning Software Engineer @ Intel

IntelShanghai, China

Pinned Repositories

DeepSpeed
DeepSpeed is a deep learning optimization library that makes distributed training and inference easy, efficient, and effective.
Language:Python0 0 00
g2
Language:Python00
internlm-20b
0 1 00
llm-continuous-batching-benchmarks
Language:Python0 0 00
Mixtral-8x7B
0 1 00
MXNet2Caffe
Convert MXNet model to Caffe model
Language:Python00
optimum-habana
Easy and lightning fast training of 🤗 Transformers on Habana Gaudi processor (HPU)
Language:Python0 0 00
paddle
Language:Python0 1 00
PaddleCustomDevice
PaddlePaddle custom device implementaion. (『飞桨』自定义硬件接入实现)
Language:Python0 0 00
PaddleFleetX
Paddle Distributed Training Examples. 飞桨分布式训练示例 Resnet Bert GPT MOE DataParallel ModelParallel PipelineParallel HybridParallel AutoParallel Zero Sharding Recompute GradientMerge Offload AMP DGC LocalSGD Wide&Deep
Language:Python0 0 00

yangulei's Repositories

yangulei/DeepSpeed
DeepSpeed is a deep learning optimization library that makes distributed training and inference easy, efficient, and effective.
Language:Python0 0 00
yangulei/g2
Language:Python00
yangulei/internlm-20b
0 1 00
yangulei/llm-continuous-batching-benchmarks
Language:Python0 0 00
yangulei/Mixtral-8x7B
0 1 00
yangulei/MXNet2Caffe
Convert MXNet model to Caffe model
Language:Python00
yangulei/optimum-habana
Easy and lightning fast training of 🤗 Transformers on Habana Gaudi processor (HPU)
Language:Python0 0 00
yangulei/paddle
Language:Python0 1 00
yangulei/PaddleCustomDevice
PaddlePaddle custom device implementaion. (『飞桨』自定义硬件接入实现)
Language:Python0 0 00
yangulei/PaddleFleetX
Paddle Distributed Training Examples. 飞桨分布式训练示例 Resnet Bert GPT MOE DataParallel ModelParallel PipelineParallel HybridParallel AutoParallel Zero Sharding Recompute GradientMerge Offload AMP DGC LocalSGD Wide&Deep
Language:Python0 0 00
yangulei/TensorRT
TensorRT is a C++ library for high performance inference on NVIDIA GPUs and deep learning accelerators.
Language:C++0 0 00
yangulei/tgi-gaudi
Large Language Model Text Generation Inference on Habana Gaudi
Language:Python0 0
yangulei/TLCBench
Benchmark scripts for TVM
Language:Python0 0
yangulei/transformers
🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.
Language:Python0 0
yangulei/tvm
Open deep learning compiler stack for cpu, gpu and specialized accelerators
Language:Python0 0

yangulei

Pinned Repositories

DeepSpeed

g2

internlm-20b

llm-continuous-batching-benchmarks

Mixtral-8x7B

MXNet2Caffe

optimum-habana

paddle

PaddleCustomDevice

PaddleFleetX

yangulei's Repositories

yangulei/DeepSpeed

yangulei/g2

yangulei/internlm-20b

yangulei/llm-continuous-batching-benchmarks

yangulei/Mixtral-8x7B

yangulei/MXNet2Caffe

yangulei/optimum-habana

yangulei/paddle

yangulei/PaddleCustomDevice

yangulei/PaddleFleetX

yangulei/TensorRT

yangulei/tgi-gaudi

yangulei/TLCBench

yangulei/transformers

yangulei/tvm