/ChineseDocumentPDF

中文论文、证券类、财报类PDF数据

Primary LanguagePythonApache License 2.0Apache-2.0

Chinese Document PDF

该仓库主要放置自己爬取国内一些中文论文网站、证券报告的PDF。

因涉及到版权问题,我这里只放置PDF链接和对应的下载脚本,小伙伴可以自行下载。

⚠️注意:url链接中可能会存在死链,大家注意处理。

如有帮助到,请给个Star!

PDF包含网站

中文论文

论文网站 URL条数
**图像图形学报 6100
计算机科学 29614
计算机系统应用 14054
软件学报 7576
计算机研究与发展 1082

证券类

财报类(来自魔搭社区)

下载脚本使用

以下载东方财富.txt为例,其他只需做简单修改,即可使用。

$ pip install requirements.txt
$ python download_east.py