/seq-monkey-data

Apache License 2.0Apache-2.0

出门问问序列猴子开源数据集

Mobvoi Sequence Moneky

序列猴子开源数据集1.0

序列猴子是出门问问提供的超大规模语言模型,基于其通用的表示与推理能力,支持多轮交互,能够大幅度提高生产效率和数据处理能力,被广泛应用于问答系统、自然语言处理、机器翻译、文本摘要等领域。

序列猴子数据集是用于训练序列猴子模型的数据集合,现选择部分数据集向公众开放。

序列猴子开源数据集1.0为序列猴子数据集的首个开源版本,涉及以下领域(请点击链接以查看详情):

使用许可

序列猴子文本开源数据集1.0整体采用Apache 2.0许可协议。您可以自由共享、改编本数据集,唯需遵循以下条款:

  • 不施加附加限制:您不得使用法律条款或技术措施来限制他人执行本许可证允许的任何操作

更新日志

  • 2024-01-31:首次发布
  • 2024-05-10:添加风格分类音频语料