/rwkv_numba

Primary LanguagePython

rwkv_numba rkwv并行推理,无需padding。

generate.py 有实例 cuda_on 需要开启 但不需要编译

O)51UFFZY~%G6D2V$S9RHOK