bojone/bytepiece

不支持指定special_token吗?

Opened this issue · 1 comments

zipzou commented

比如将\n处理为<n>

bojone commented

个人认为这不是一个tokenizer该做的事情,tokenizer的作用就是对原始字节串进行切分,这种特殊需求可以自行包装一层。