论文文本抽取

通过pdfminer从论文中抽取文本信息

  • pdf_acl 抽取acl模板论文
  • pdf_general 适用于全部论文
  • pdf_no_sort 简单抽取,不调整顺序