一 该项目的目的

主要是对保险行业的pdf文档进行数据结构化:
  1、文章结构化;
  2、提取保险条款的名称与解释。
  3、条款得三级格式化

二 结构化之后的数据格式

见json文件,解析的是天安人寿2019 的一个条款;

三 结构