- 由军委部资助,中电28所主办,希望通过机器阅读,对于给定的专业类文章,能够在文中定位、分析、推理指定问题的答案。
- 比赛官网:军事智能机器阅读挑战赛官网
- 比赛成绩:14th/247(Top 5%)
- 队友:lhliu
- 比赛数据:LesMMRC
- python版本:3.5.4
- CUDA版本:8.0
- 依赖库:
- numpy 1.13.3
- gensim 3.6.0
- jieba 0.39
- torch 0.4.1
- 官方提供的问题答案是自然语言文本,经人工阅读发现,答案大约由以下三种方式生成:
- 原封不动从原文中抽取出
- 从原文抽取后进行细微改动
- 人工进一步总结生成
- 基于上述考虑,借鉴百度DuReader的预处理方式,将答案自然语言文本映射到原文片段,即用[start, end]的区间形式描述答案文本。
- 将本任务定义为片段型阅读理解
- 采用BIDAF模型作为baseline,最终采用SLQA集成模型提交结果。
- 集成方式:对不同参数单模型的多个检查点做集成。