💡 [qwen-vl-chat-v1 返回结果优化] - <目前返回结果内容方案和其它模型不同，建议添加配置项>

nextdoorUncleLiu opened this issue a month ago · 0 comments

nextdoorUncleLiu commented a month ago

起始日期 | Start Date

5/14/2024

实现PR | Implementation PR

qwen-vl-chat-v1 添加一个配置项，可支持类似 qw-max 的返回方式，我不需要当前生成的整个序列，我只需要最新的内容即可
由于我使用了多个通义模型，我不想因为个别模型在返回结果上我在做特殊处理

相关Issues | Reference Issues

No response

摘要 | Summary

假设我有一个请求，我希望返回的内容是123，全部都使用流式返回，且每个模型都有3次返回
qw-max返回的内容分别是1、2、3；
qwen-vl-chat-v1返回的内容分别是1、12、123

基本示例 | Basic Example

实现方案按照官方文档即可

缺陷 | Drawbacks

不会造成影响，只是返回结果时不返回之前内容即可

未解决问题 | Unresolved questions

No response