FasterDecoding/Medusa

Medusa: Simple Framework for Accelerating LLM Generation with Multiple Decoding Heads

Jupyter NotebookApache-2.0

Readme
92Issues
2.4kStargazers
31Watchers

Watchers

Contact site admin: Geeks.