- :fa-check: post addresss: https://www.douban.com/accounts/login
- :fa-check: capthca address: https://www.douban.com/
- :fa-check: 使用tesseract-ocr进行验证码识别, 需要下载安装并且设置环境变量**wiki**
- :fa-check: url https://movie.douban.com/cinema/nowplaying/beijing
- :fa-check:使用jieba wordcloud pandas matplotlib等技术进行影评分析
- :fa-check: readmoviedata.py 是对保存的文件进行分析生成图片img
- :fa-check: url:https://www.lagou.com/zhaopin/Java/
- :fa-check: 需要构造header,不能直接网页访问网页
- :fa-check: 抓取30页的数据需要休眠,
- :fa-check: url:https://www.lagou.com/zhaopin/Java/1/?filterOption=1