pdf转文本,搜索信息写入excel,用于年报信息提取
在https://github.com/yooongchun/pdf_extractor 的基础上修改而来
程序将指定文件夹内的pdf文件转为temp_txt文件夹下的txt文件,并从txt中提取targer.xlsx指定的关键词所在上下文,存入指定输出excel中。
target.xlsx中第一行第二列开始为关键词。
已经打包为ExtractPDF.exe文件,可以直接使用。
pdf转文本,搜索信息写入excel,用于年报信息提取
在https://github.com/yooongchun/pdf_extractor 的基础上修改而来
程序将指定文件夹内的pdf文件转为temp_txt文件夹下的txt文件,并从txt中提取targer.xlsx指定的关键词所在上下文,存入指定输出excel中。
target.xlsx中第一行第二列开始为关键词。
已经打包为ExtractPDF.exe文件,可以直接使用。