/LesMMRC

2018年“莱斯杯”军事智能机器阅读挑战赛(Top 5% 14th/247)

Primary LanguagePython

2018年“莱斯杯”军事智能机器阅读挑战赛

  • 由军委部资助,中电28所主办,希望通过机器阅读,对于给定的专业类文章,能够在文中定位、分析、推理指定问题的答案。
  • 比赛官网:军事智能机器阅读挑战赛官网
  • 比赛成绩:14th/247(Top 5%)
  • 队友:lhliu
  • 比赛数据:LesMMRC

运行环境

  • python版本:3.5.4
  • CUDA版本:8.0
  • 依赖库:
    • numpy 1.13.3
    • gensim 3.6.0
    • jieba 0.39
    • torch 0.4.1

处理思路

  • 官方提供的问题答案是自然语言文本,经人工阅读发现,答案大约由以下三种方式生成:
    • 原封不动从原文中抽取出
    • 从原文抽取后进行细微改动
    • 人工进一步总结生成
  • 基于上述考虑,借鉴百度DuReader的预处理方式,将答案自然语言文本映射到原文片段,即用[start, end]的区间形式描述答案文本。
    • 将本任务定义为片段型阅读理解
  • 采用BIDAF模型作为baseline,最终采用SLQA集成模型提交结果。
  • 集成方式:对不同参数单模型的多个检查点做集成。