AnonymousYWL

Hypersonic

Pinned Repositories

alphatensor
Language:Python0 0 00
awesome-tensor-compilers
A list of awesome compiler projects and papers for tensor computation and deep learning.
00
FeatherCNN
FeatherCNN is a high performance inference engine for convolutional neural networks.
Language:C++0 0 00
Flash-Attention-Softmax-N
CUDA and Triton implementations of Flash Attention with SoftmaxN.
Language:Python00
gluon-cv
Gluon CV Toolkit
Language:Python00
hipBLAS
ROCm BLAS marshalling library
Language:C++0 0 00
HowToCook
程序员在家做饭方法指南。Programmer's guide about how to cook at home (Chinese only).
Language:JavaScript0 0 00
LibShalom
Language:C24 1 610
MYLIB
Language:C17 1 13
TPDS
Language:C11

AnonymousYWL's Repositories

AnonymousYWL/LibShalom
Language:C24 1 610
AnonymousYWL/MYLIB
Language:C17 1 13
AnonymousYWL/TPDS
Language:C11
AnonymousYWL/alphatensor
Language:Python0 0 00
AnonymousYWL/awesome-tensor-compilers
A list of awesome compiler projects and papers for tensor computation and deep learning.
00
AnonymousYWL/FeatherCNN
FeatherCNN is a high performance inference engine for convolutional neural networks.
Language:C++0 0 00
AnonymousYWL/Flash-Attention-Softmax-N
CUDA and Triton implementations of Flash Attention with SoftmaxN.
Language:Python00
AnonymousYWL/gluon-cv
Gluon CV Toolkit
Language:Python00
AnonymousYWL/hipBLAS
ROCm BLAS marshalling library
Language:C++0 0 00
AnonymousYWL/HowToCook
程序员在家做饭方法指南。Programmer's guide about how to cook at home (Chinese only).
Language:JavaScript0 0 00
AnonymousYWL/incubator-mxnet
Lightweight, Portable, Flexible Distributed/Mobile Deep Learning with Dynamic, Mutation-aware Dataflow Dep Scheduler; for Python, R, Julia, Scala, Go, Javascript and more
Language:C++00
AnonymousYWL/lingweiyang.github.io
Language:HTML0 1 00
AnonymousYWL/intel-extension-for-transformers
⚡ Build your chatbot within minutes on your favorite device; offer SOTA compression techniques for LLMs; run LLMs efficiently on Intel Platforms⚡
AnonymousYWL/LLM-Viewer
Analyze the inference of Large Language Models (LLMs). Analyze aspects like computation, storage, transmission, and hardware roofline model in a user-friendly interface.
AnonymousYWL/models
A collection of pre-trained, state-of-the-art models in the ONNX format
Language:Jupyter Notebook0 0
AnonymousYWL/oneDNN
oneAPI Deep Neural Network Library (oneDNN)
Language:C++0 0
AnonymousYWL/Optimizing-DGEMM-on-Intel-CPUs-with-AVX512F
Stepwise optimizations of DGEMM on CPU, reaching performance faster than Intel MKL eventually.
Language:C0 0
AnonymousYWL/rankfm
Factorization Machines for Recommendation and Ranking Problems with Implicit Feedback Data
AnonymousYWL/SMM
1 0
AnonymousYWL/sparse-register-tiling
AnonymousYWL/STM-Multifrontal-QR-Factorization-Empowered-by-GCN
Language:C0 0
AnonymousYWL/TileSpGEMM
Source code of the PPoPP '22 paper: "TileSpGEMM: A Tiled Algorithm for Parallel Sparse General Matrix-Matrix Multiplication on GPUs" by Yuyao Niu, Zhengyang Lu, Haonan Ji, Shuhui Song, Zhou Jin, and Weifeng Liu.
Language:C0 0
AnonymousYWL/tsm2x-imp
Implementation of TSM2L and TSM2R -- High-Performance Tall-and-Skinny Matrix-Matrix Multiplication Algorithms for CUDA

AnonymousYWL

Pinned Repositories

alphatensor

awesome-tensor-compilers

FeatherCNN

Flash-Attention-Softmax-N

gluon-cv

hipBLAS

HowToCook

LibShalom

MYLIB

TPDS

AnonymousYWL's Repositories

AnonymousYWL/LibShalom

AnonymousYWL/MYLIB

AnonymousYWL/TPDS

AnonymousYWL/alphatensor

AnonymousYWL/awesome-tensor-compilers

AnonymousYWL/FeatherCNN

AnonymousYWL/Flash-Attention-Softmax-N

AnonymousYWL/gluon-cv

AnonymousYWL/hipBLAS

AnonymousYWL/HowToCook

AnonymousYWL/incubator-mxnet

AnonymousYWL/lingweiyang.github.io

AnonymousYWL/intel-extension-for-transformers

AnonymousYWL/LLM-Viewer

AnonymousYWL/models

AnonymousYWL/oneDNN

AnonymousYWL/Optimizing-DGEMM-on-Intel-CPUs-with-AVX512F

AnonymousYWL/rankfm

AnonymousYWL/SMM

AnonymousYWL/sparse-register-tiling

AnonymousYWL/STM-Multifrontal-QR-Factorization-Empowered-by-GCN

AnonymousYWL/TileSpGEMM

AnonymousYWL/tsm2x-imp