wuxi-dixi/chinese_science_paper_to_text
读取多层级目录下的pdf文件,通常是爬虫爬下来的,将其中摘要和正文抽取出来。可以快速抽取想要的文本内容。
PythonGPL-2.0
Watchers
No one’s watching this repository yet.
读取多层级目录下的pdf文件,通常是爬虫爬下来的,将其中摘要和正文抽取出来。可以快速抽取想要的文本内容。
PythonGPL-2.0
No one’s watching this repository yet.