aredden/flux-fp8-api

Flux diffusion model implementation using quantized fp8 matmul & remaining layers use faster half precision accumulate, which is ~2x faster on consumer devices.

PythonApache-2.0

Watchers

aredden
Remote
ashakoen
drkostas
University of Tennessee, Knoxville
flowpoint
huemin-art
Ronsor