/chinese_science_paper_to_text

读取多层级目录下的pdf文件,通常是爬虫爬下来的,将其中摘要和正文抽取出来。可以快速抽取想要的文本内容。

Primary LanguagePythonGNU General Public License v2.0GPL-2.0

Watchers

No one’s watching this repository yet.