szxSpark/LesMMRC

2018年“莱斯杯”军事智能机器阅读挑战赛（Top 5% 14th/247）

Python

2018年“莱斯杯”军事智能机器阅读挑战赛

由军委部资助，中电28所主办，希望通过机器阅读，对于给定的专业类文章，能够在文中定位、分析、推理指定问题的答案。
比赛官网：军事智能机器阅读挑战赛官网
比赛成绩：14th/247（Top 5%）
队友：lhliu
比赛数据：LesMMRC

运行环境

python版本：3.5.4
CUDA版本：8.0
依赖库：
- numpy 1.13.3
- gensim 3.6.0
- jieba 0.39
- torch 0.4.1

处理思路

官方提供的问题答案是自然语言文本，经人工阅读发现，答案大约由以下三种方式生成：
- 原封不动从原文中抽取出
- 从原文抽取后进行细微改动
- 人工进一步总结生成
基于上述考虑，借鉴百度DuReader的预处理方式，将答案自然语言文本映射到原文片段，即用[start, end]的区间形式描述答案文本。
- 将本任务定义为片段型阅读理解
采用BIDAF模型作为baseline，最终采用SLQA集成模型提交结果。
集成方式：对不同参数单模型的多个检查点做集成。