"**法研杯"司法人工智能挑战赛2019说明

一、简介

法律智能研究旨在赋予机器理解法律文本的能力。近些年来，随着以裁判文书为代表的司法大数据不断公开，以及自然语言处理技术的不断突破，如何将人工智能技术应用在司法领域，来提高司法人员在案件处理环节的效率逐渐成为法律智能研究的热点。为了促进智慧司法相关技术的发展，在最高人民法院信息中心、**中文信息学会和共青团**青年发展部的指导下，**司法大数据研究院、**中文信息学会社会媒体处理专委会、**中文信息学会计算语言学专委会、**中文信息学会语言与知识计算专委会、**中文信息学会评测工委会、**电科集团科技部、**电科团委联合清华大学、北京大学、哈尔滨工业大学、**科学院软件研究所和**科学院自动化所，在科大讯飞、国双科技和幂律智能的支持下，继续共同举办“2019**‘法研杯’司法人工智能挑战赛（CAIL2019）”。本次挑战赛聚焦在法律要素抽取、法律阅读理解、相似案例匹配三个真实场景的任务，提供海量的已标注的法律文书数据，旨在为研究者提供学术交流平台，推动语言理解和人工智能领域技术在法律领域的应用，促进法律人工智能事业的发展。今年预计于10月在北京举办颁奖会和技术研讨会。诚邀学术界和工业界的研究者和开发者积极参与，比赛中发现的重大基础性问题，在国家自然科学基金专项资金中将予以重点考虑！

二、任务说明

2.1 介绍

任务一（阅读理解）：裁判文书中包含了丰富的案件信息，比如时间、地点、人物关系等等，通过机器智能化地阅读理解裁判文书，可以更快速、便捷地辅助法官、律师以及普通大众获取所需信息。本任务是首次基于中文裁判文书的阅读理解比赛，属于篇章片段抽取型阅读理解比赛（Span-Extraction Machine Reading Comprehension）。为了增加问题的多样性，参考英文阅读理解比赛SQuAD和CoQA，本比赛增加了拒答以及是否类（YES/NO）问题。
任务二（要素识别）：本任务的主要目的是为了将案件描述中重要事实描述自动抽取出来，并根据领域专家设计的案情要素体系进行分类。案情要素抽取的结果可以用于案情摘要、可解释性的类案推送以及相关知识推荐等司法领域的实际业务需求中。具体地，给定司法文书中的相关段落，系统需针对文书中每个句子进行判断，识别其中的关键案情要素。本任务共涉及三个领域，包括婚姻家庭、劳动争议、借款合同等领域。
任务三（相似案例匹配）：本任务是针对多篇法律文书进行相似度的计算和判断。具体来说，对于每份文书我们提供文书的标题和事实描述，选手需要从两篇候选集文书中找到与询问文书更为相似的一篇文书。为了减小选手的工作量，我们相似案例匹配的数据只涉及民间借贷、知识产权纠纷和海商海事这三类文书。

参赛者可选择一个或者多个任务参与挑战赛。同时，如果需要了解更多关于具体任务的详细信息，可以在官网进行查看。

FAQ

0. 有没有选手交流的平台？

选手交流QQ群：237633234。

1. 从哪里可以下载到数据集？

等待链接。

6d6d/CAIL2019