💡 [qwen-vl-chat-v1 返回结果优化] - <目前返回结果内容方案和其它模型不同,建议添加配置项>
nextdoorUncleLiu opened this issue · 0 comments
nextdoorUncleLiu commented
起始日期 | Start Date
5/14/2024
实现PR | Implementation PR
- qwen-vl-chat-v1 添加一个配置项,可支持类似 qw-max 的返回方式,我不需要当前生成的整个序列,我只需要最新的内容即可
- 由于我使用了多个通义模型,我不想因为个别模型在返回结果上我在做特殊处理
相关Issues | Reference Issues
No response
摘要 | Summary
- 假设我有一个请求,我希望返回的内容是123,全部都使用流式返回,且每个模型都有3次返回
- qw-max返回的内容分别是1、2、3;
- qwen-vl-chat-v1返回的内容分别是1、12、123
基本示例 | Basic Example
实现方案按照官方文档即可
缺陷 | Drawbacks
不会造成影响,只是返回结果时不返回之前内容即可
未解决问题 | Unresolved questions
No response