wuxi-dixi/chinese_science_paper_to_text

读取多层级目录下的pdf文件，通常是爬虫爬下来的，将其中摘要和正文抽取出来。可以快速抽取想要的文本内容。

PythonGPL-2.0

Watchers

No one’s watching this repository yet.