junliume

AMDSunnyvale, CA

Pinned Repositories

googletest
GoogleTest - Google Testing and Mocking Framework
Language:C++0 0 00
how-to-optimize-gemm
Language:C0 0 01
Quantum
Microsoft Quantum Development Kit Samples
Language:Jupyter Notebook0 0 00
TorchBench
TorchBench is a collection of open source benchmarks used to evaluate PyTorch performance.
Language:Python0 0 00
tvm
Open deep learning compiler stack for cpu, gpu and specialized accelerators
Language:Python0 0 00
AITemplate
AITemplate is a Python framework which renders neural network into high performance CUDA/HIP C++ code. Specialized for FP16 TensorCore (NVIDIA GPU) and MatrixCore (AMD GPU) inference.
Language:Python11 3 117
composable_kernel
Composable Kernel: Performance Portable Programming Model for Machine Learning Tensor Operators
Language:C++328 26 232135
MIOpen
AMD's Machine Intelligence Library
Language:Assembly1.1k 91 1.1k232
MITuna
Language:Python7 10 3610
rocComposer
AMD composer for High Performance Deep Learning Kernels and Libraries
0 5 00

junliume's Repositories

junliume/googletest
GoogleTest - Google Testing and Mocking Framework
Language:C++0 0 00
junliume/how-to-optimize-gemm
Language:C0 0 01
junliume/Quantum
Microsoft Quantum Development Kit Samples
Language:Jupyter Notebook0 0 00
junliume/TorchBench
TorchBench is a collection of open source benchmarks used to evaluate PyTorch performance.
Language:Python0 0 00
junliume/tvm
Open deep learning compiler stack for cpu, gpu and specialized accelerators
Language:Python0 0 00
junliume/ZLUDA
CUDA on AMD GPUs
Language:Rust0 0