#说明文档

###1. docx2json.py 为解析各类题目的基础框架,其基础步骤是:

  1. 分析word版面,把所有可能是题目题号的模式全部得到(analys_layout_)
  2. 出现最多的题目的模式,被认为是最主要的题目模式(小题),出现次数第二多的, 且和主模式不同的,不包含[()()]的认为是次要模式(大题)
  3. 逐个处理次要模式(大题)--->逐个处理小题--->逐个选项处理,
  4. 结果只得到的各个题目 只包含该题在文本中的段落号的集合
  5. 最好逐个解析各个题目