本仓库已迁移至 tanjunchen/cloud-native-travel,欢迎大家关注新仓库,与大家一起分享探索云原生趣事。
本仓库案例仅供学习,请勿商用!!!
- 百科分布式数据抓取案例
- 房天下
- **邮政编码
- 猫眼
- **房价行情网
- 康美中药
- 58 到家
- 自如租房(图片简单识别)
- **木材指数网
- 全国投资项目在线审批监督平台(webdriver + 表格数据抓取)
- **裁判文书网(前端 JS 加密)
- ITChat 微信机器人
- 投融界投资数据
- 企名片数据抓取(js 加密)
- 网易云音乐(webdriver 版本 + BS 解析与多进程版本)
- zcool 轮换验证码实验
- mitmproxy 代理抓包
- 拉勾网(封 IP + 数据混淆)
- 去哪儿网(数字顺序颠倒)
- IT桔子网(表格抓取 + 封 IP)
- 全网代理 IP(端口混淆 JS 字符替换)
- InfoQ 文章抓取(asyncio + mongo)
- 汽车之家、猫眼(font-face 字体解密)
- 东方财富网(上证指数 + 深证指数 + 指数成分 + 财务报表数据)
- 全国农产品指数(amf 数据传输格式问题)
- csdn
- pandas
- selenium
- requests
- BeautifulSoup
- lxml(etree)
- jieba
- numpy
- sqlalchemy
- fake_useragent
- openpyxl
- pymysql
- itchat
- execjs
- pytesseract
- pymongo
有任何疑问请提出 issue, 互相交流学习,如果对您学习爬虫有些帮助,Star 吧,哈哈哈....