GPUStack

Open-source GPU cluster manager for running large language models(LLMs)

Pinned Repositories

.github
Meta-Github repository for all GPUStack repositories.
Language:Dockerfile0 2 00
fastfetch
Like neofetch, but much faster because written mostly in C.
Language:C0 0 02
gguf-packer-go
Deliver LLMs of GGUF format via Dockerfile.
Language:Go11 3 03
gguf-parser-go
Review/Check GGUF files and estimate the memory usage and maximum tokens per second.
Language:Go136 5 715
gpustack
Manage GPU clusters for running AI models
Language:Python2.3k 28 913232
gpustack-ui
Language:TypeScript20 4 117
gpustack.github.io
Language:HTML0 4 01
llama-box
LM inference server implementation based on *.cpp.
Language:C++154 9 4116
vox-box
A text-to-speech and speech-to-text server compatible with the OpenAI API, supporting Whisper, FunASR, Bark, and CosyVoice backends.
Language:Python86 5 109

GPUStack's Repositories

gpustack/gpustack
Manage GPU clusters for running AI models
Language:Python2.3k 28 913232
gpustack/llama-box
LM inference server implementation based on *.cpp.
Language:C++154 9 4116
gpustack/gguf-parser-go
Review/Check GGUF files and estimate the memory usage and maximum tokens per second.
Language:Go136 5 715
gpustack/vox-box
A text-to-speech and speech-to-text server compatible with the OpenAI API, supporting Whisper, FunASR, Bark, and CosyVoice backends.
Language:Python86 5 109
gpustack/gpustack-ui
Language:TypeScript20 4 117
gpustack/gguf-packer-go
Deliver LLMs of GGUF format via Dockerfile.
Language:Go11 3 03
gpustack/.github
Meta-Github repository for all GPUStack repositories.
Language:Dockerfile0 2 00
gpustack/fastfetch
Like neofetch, but much faster because written mostly in C.
Language:C0 0 02
gpustack/gpustack.github.io
Language:HTML0 4 01