/CNKI-crawler

知网的小爬虫

Primary LanguagePythonGNU Affero General Public License v3.0AGPL-3.0

1.py 是爬虫代码
2.py 是获取三元组代码
注意事项:
1. 爬虫驱动采用的是谷歌浏览器驱动,具体爬取时,请根据你自己的浏览器以及浏览器版本自行下载驱动。
    本代码驱动器为谷歌浏览器驱动器,适用谷歌浏览器版本为103
2. 运行1.py前请先打开Neo4j,根据你的Neo4j数据库进行配置数据库的连接
3. 爬取过程请确保网络通畅
4. 确保电脑有MySQL,同时注意数据库用户名密码!

本代码仅供学习参考使用,禁止任何商用!!!
如有问题,请联系QQ:1909985972