/extractPDFtotxttoexcel

pdf转文本,搜索信息写入excel,用于年报信息提取

Primary LanguagePython

extractPDFtotxttoexcel

pdf转文本,搜索信息写入excel,用于年报信息提取

https://github.com/yooongchun/pdf_extractor 的基础上修改而来

程序将指定文件夹内的pdf文件转为temp_txt文件夹下的txt文件,并从txt中提取targer.xlsx指定的关键词所在上下文,存入指定输出excel中。

target.xlsx中第一行第二列开始为关键词。

已经打包为ExtractPDF.exe文件,可以直接使用。