PanZaifeng

机械工程学士

Alibaba PAI

Pinned Repositories

BladeDISC
BladeDISC is an end-to-end DynamIc Shape Compiler project for machine learning workloads.
Language:C++00
caffe
Caffe: a fast open framework for deep learning.
Language:C++0 0 00
cub
Cooperative primitives for CUDA C++.
Language:Cuda0 0 00
G-SLIDE
Language:Cuda131
HashingDeepLearning
Codebase for "SLIDE : In Defense of Smart Algorithms over Hardware Acceleration for Large-Scale Deep Learning Systems"
Language:C++0 0 00
moderngpu
Patterns and behaviors for GPU computing
Language:C++0 0 00
panzaifeng.github.io
Language:HTML1 2 00
RecFlex
A recommendation model kernel optimizing system
Language:Python70
recom
Language:C++0 0 00
vimrc
my simple vim configuration
Language:Vim Script10

PanZaifeng's Repositories

PanZaifeng/G-SLIDE
Language:Cuda131
PanZaifeng/RecFlex
A recommendation model kernel optimizing system
Language:Python70
PanZaifeng/panzaifeng.github.io
Language:HTML1 2 00
PanZaifeng/vimrc
my simple vim configuration
Language:Vim Script10
PanZaifeng/BladeDISC
BladeDISC is an end-to-end DynamIc Shape Compiler project for machine learning workloads.
Language:C++00
PanZaifeng/caffe
Caffe: a fast open framework for deep learning.
Language:C++0 0 00
PanZaifeng/cub
Cooperative primitives for CUDA C++.
Language:Cuda0 0 00
PanZaifeng/HashingDeepLearning
Codebase for "SLIDE : In Defense of Smart Algorithms over Hardware Acceleration for Large-Scale Deep Learning Systems"
Language:C++0 0 00
PanZaifeng/moderngpu
Patterns and behaviors for GPU computing
Language:C++0 0 00
PanZaifeng/recom
Language:C++0 0 00
PanZaifeng/tensorflow
An Open Source Machine Learning Framework for Everyone
Language:C++0 0 00
PanZaifeng/the-algorithm
Source code for Twitter's Recommendation Algorithm
Language:Scala00
PanZaifeng/Vitis_Libraries
Vitis Libraries
Language:C++00
PanZaifeng/TensorRT-LLM
TensorRT-LLM provides users with an easy-to-use Python API to define Large Language Models (LLMs) and build TensorRT engines that contain state-of-the-art optimizations to perform inference efficiently on NVIDIA GPUs. TensorRT-LLM also contains components to create Python and C++ runtimes that execute those TensorRT engines.