FasterDecoding/Medusa

Medusa: Simple Framework for Accelerating LLM Generation with Multiple Decoding Heads

Jupyter NotebookApache-2.0

Readme
75Issues
1.9kStargazers
34Watchers

Stargazers

Prev
Next

Contact site admin: Geeks.