YukeWang96

Ph.D. candidate at the University of California, Santa Barbara | System/Compiler for Deep Learning

University of California, Santa BarbaraSanta Barbara, US

Pinned Repositories

AlCOP_MLSys23
Artifact for MLSys'23: ALCOP: Automatic Load-Compute Pipelining in Deep Learning Compiler for AI-GPUs.
Language:Python10
APNN-TC_SC21
Artifact for SC21: APNN-TC: Accelerating Arbitrary Precision Neural Networks on Ampere GPU Tensor Cores.
Language:Cuda1 0 00
CNN-TensorRT
Benchmarking TensorRT on CNN models
Language:Jupyter Notebook1 2 00
CS263-project
UCSB CS263 Project for Spring 2020 Quarter
Language:C22
DSXplore_IPDPS21
Artifact for IPDPS'21: DSXplore: Optimizing Convolutional Neural Networks via Sliding-Channel Convolutions.
Language:Python13 3 25
GNNAdvisor_OSDI21
Artifact for OSDI'21 GNNAdvisor: An Adaptive and Efficient Runtime System for GNN Acceleration on GPUs.
Language:Cuda61 2 719
MGG_OSDI23
Artifact for OSDI'23: MGG: Accelerating Graph Neural Networks with Fine-grained intra-kernel Communication-Computation Pipelining on Multi-GPU Platforms.
Language:Cuda31 2 53
QGTC_PPoPP22
Artifact for PPoPP22 QGTC: Accelerating Quantized GNN via GPU Tensor Core.
Language:Python28 2 13
SGQuant
SGQuant: Squeezing the Last Bit on Graph Neural Networks with Specialized Quantization
Language:Python8 3 02
TC-GNN_ATC23
Artifact for USENIX ATC'23: TC-GNN: Bridging Sparse GNN Computation and Dense Tensor Cores on GPUs.
Language:Python41 2 612

YukeWang96's Repositories

YukeWang96/GNNAdvisor_OSDI21
Artifact for OSDI'21 GNNAdvisor: An Adaptive and Efficient Runtime System for GNN Acceleration on GPUs.
Language:Cuda61 2 719
YukeWang96/TC-GNN_ATC23
Artifact for USENIX ATC'23: TC-GNN: Bridging Sparse GNN Computation and Dense Tensor Cores on GPUs.
Language:Python41 2 612
YukeWang96/MGG_OSDI23
Artifact for OSDI'23: MGG: Accelerating Graph Neural Networks with Fine-grained intra-kernel Communication-Computation Pipelining on Multi-GPU Platforms.
Language:Cuda31 2 53
YukeWang96/QGTC_PPoPP22
Artifact for PPoPP22 QGTC: Accelerating Quantized GNN via GPU Tensor Core.
Language:Python28 2 13
YukeWang96/DSXplore_IPDPS21
Artifact for IPDPS'21: DSXplore: Optimizing Convolutional Neural Networks via Sliding-Channel Convolutions.
Language:Python13 3 25
YukeWang96/SGQuant
SGQuant: Squeezing the Last Bit on Graph Neural Networks with Specialized Quantization
Language:Python8 3 02
YukeWang96/AlCOP_MLSys23
Artifact for MLSys'23: ALCOP: Automatic Load-Compute Pipelining in Deep Learning Compiler for AI-GPUs.
Language:Python10
YukeWang96/APNN-TC_SC21
Artifact for SC21: APNN-TC: Accelerating Arbitrary Precision Neural Networks on Ampere GPU Tensor Cores.
Language:Cuda1 0 00
YukeWang96/CNN-TensorRT
Benchmarking TensorRT on CNN models
Language:Jupyter Notebook1 2 00
YukeWang96/APNN-TC-kernel
Language:Cuda2 03
YukeWang96/cuda-samples
Samples for CUDA Developers which demonstrates features in CUDA Toolkit
Language:C1 0
YukeWang96/CUDALibrarySamples
CUDA Library Samples
Language:Cuda1 0
YukeWang96/cutlass
CUDA Templates for Linear Algebra Subroutines
Language:C++1 0
YukeWang96/dgl_pydirect_internal
dgl_pydirect for multi-GPU full-graph computation
Language:Python1 0
YukeWang96/docker-pytorch
A Docker image for PyTorch
Language:Dockerfile1 0
YukeWang96/EL-Rec_SC22
Artifact for SC'22: EL-Rec: Efficient Large-scale Recommendation Model Training via Tensor-Train Embedding Table.
Language:Cuda0 0
YukeWang96/Faith_ATC22
Artifact for Faith: An Efficient Framework for Transformer Verification on GPUs.
Language:Jupyter Notebook0 0
YukeWang96/fast-dpsgd
Code for fast dpsgd implementations in JAX/TF
YukeWang96/github_page
2 0
YukeWang96/llvm-build
Docker file for build LLVM LibTooling
Language:Dockerfile2 0
YukeWang96/openshmem-examples
Some miscellaneous OpenSHMEM examples
Language:C1 0
YukeWang96/personal_page
Language:JavaScript1 0
YukeWang96/rosette
The Rosette solver-aided host language, sample solver-aided DSLs, and demos
Language:Racket1 0
YukeWang96/sc21_AD
Language:Shell2 0
YukeWang96/TCGNN-bSpmm
Language:Python1 0
YukeWang96/TCGNN-trition
Language:C++
YukeWang96/TCGNN-tsparse
Language:Cuda1 0
YukeWang96/tutorials
PyTorch tutorials.
Language:Python1 0
YukeWang96/tutorials-1
Training material for IPU users: tutorials, feature examples, simple applications
Language:Jupyter Notebook1 0
YukeWang96/YukeWang96.github.io
A beautiful, simple, clean, and responsive Jekyll theme for academics
Language:JavaScript1 0