parvizmp

Intel

Pinned Repositories

neural-speed
An innovative library for efficient LLM inference via low-bit quantization
Language:C++348 8 4737
xetla
Language:C++59 7 317
openvino.genai
Run Generative AI models with simple C++/Python API and using OpenVINO Runtime
Language:C++149 31 87171
neural-speed
An innovation library for efficient LLM inference via low-bit quantization and sparsity
Language:C++00
xetla
Language:C++00

parvizmp's Repositories

parvizmp/neural-speed
An innovation library for efficient LLM inference via low-bit quantization and sparsity
Language:C++00
parvizmp/xetla
Language:C++00