QwenLM/Qwen-VL

💡 [qwen-vl-chat-v1 返回结果优化] - <目前返回结果内容方案和其它模型不同,建议添加配置项>

nextdoorUncleLiu opened this issue · 0 comments

起始日期 | Start Date

5/14/2024

实现PR | Implementation PR

  • qwen-vl-chat-v1 添加一个配置项,可支持类似 qw-max 的返回方式,我不需要当前生成的整个序列,我只需要最新的内容即可
  • 由于我使用了多个通义模型,我不想因为个别模型在返回结果上我在做特殊处理

相关Issues | Reference Issues

No response

摘要 | Summary

  • 假设我有一个请求,我希望返回的内容是123,全部都使用流式返回,且每个模型都有3次返回
  • qw-max返回的内容分别是1、2、3;
  • qwen-vl-chat-v1返回的内容分别是1、12、123

基本示例 | Basic Example

实现方案按照官方文档即可

缺陷 | Drawbacks

不会造成影响,只是返回结果时不返回之前内容即可

未解决问题 | Unresolved questions

No response