索引

本页面按照自然语言处理任务进行分类,索引了开源的中文数据集信息,旨在帮助新人快速发现和浏览每个任务已有的开源数据集。本页面的所有内容都托管在『Gitee』和『GitHub』,欢迎更多的贡献者共同编辑中文自然语言处理数据集信息索引。

词法分析

句法分析

语义解析

文本分类

文本相似度

情感分析

信息抽取

文本生成

问答系统

对话系统

机器翻译

多模态

知识图谱

添加数据集

  • 如何添加:点击顶部Github入口,即可在Github上浏览、添加新数据集,或创建新的任务,并为新任务添加数据集。

  • 添加数据集:添加时,请为数据集添加以下元素: 简介:简要描述数据集及相关引用。 详情:用表格形式添加新数据集的名称、作者、论文、评测等信息,并添加相应的下载链接(若有)。 引用:添加基于该数据集发表的相关论文。

  • 注意事项:成功提交数据集后,您的数据集将会默认在千言数据集的Gitee账号上同步更新,如有问题,欢迎联系我们:luge_ai@126.com