spider

There are 2805 repositories under spider topic.

NaiboWang/EasySpider
A visual no-code/code-free web crawler/spider易采集：一个可视化浏览器自动化测试/数据采集/爬虫软件，可以无代码图形化的设计和执行爬虫任务。别名：ServiceWrapper面向Web应用的智能化服务封装系统。
Language:JavaScript36.6k 230 5624.5k
gocolly/colly
Elegant Scraper and Crawler Framework for Golang
Language:Go23.5k 335 5521.8k
jhao104/proxy_pool
Python ProxyPool for web spider
Language:Python21.8k 446 6165.2k
shengqiangzhang/examples-of-web-crawlers
一些非常有趣的python爬虫例子,对新手比较友好,主要爬取淘宝、天猫、微信、微信读书、豆瓣、QQ等网站。(Some interesting examples of python crawlers that are friendly to beginners. )
Language:Python14k 348 1143.8k
crawlab-team/crawlab
Distributed web crawler admin platform for spiders management regardless of languages and frameworks. 分布式爬虫管理平台，支持任何语言和框架
Language:Go11.4k 214 9401.8k
s0md3v/Photon
Incredibly fast crawler designed for OSINT.
Language:Python11.1k 323 1061.5k
Evil0ctal/Douyin_TikTok_Download_API
🚀「Douyin_TikTok_Download_API」是一个开箱即用的高性能异步抖音、快手、TikTok、Bilibili数据爬取工具，支持API调用，在线批量解析及下载。
Language:Python9.8k 67 4571.5k
ssssssss-team/spider-flow
新一代爬虫平台，以图形化方式定义爬虫流程，不写代码即可完成爬虫。
Language:Java9.7k 96 431.9k
guyueyingmu/avbook
AV 电影管理系统， avmoo , javbus , javlibrary 爬虫，线上 AV 影片图书馆，AV 磁力链接数据库，Japanese Adult Video Library,Adult Video Magnet Links - Japanese Adult Video Database
Language:PHP9.5k 341 1372k
kangvcar/InfoSpider
INFO-SPIDER 是一个集众多数据源于一身的爬虫工具箱🧰，旨在安全快捷的帮助用户拿回自己的数据，工具代码开源，流程透明。支持数据源包括GitHub、QQ邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail邮箱、Outlook邮箱、京东、淘宝、支付宝、**移动、**联通、**电信、知乎、哔哩哔哩、网易云音乐、QQ好友、QQ群、生成朋友圈相册、浏览器浏览历史、12306、博客园、CSDN博客、开源**博客、简书。
Language:Python7.9k 179 411.5k
andeya/pholcus
Pholcus is a distributed high-concurrency crawler software written in pure golang
Language:Go7.6k 454 901.7k
luyishisi/Anti-Anti-Spider
越来越多的网站具有反爬虫特性，有的用图片隐藏关键数据，有的使用反人类的验证码，建立反反爬虫的代码仓库，通过与不同特性的网站做斗争（无恶意）提高技术。（欢迎提交难以采集的网站）（因工作原因，项目暂停）
Language:Python7.3k 449 362.2k
lorien/awesome-web-scraping
List of libraries, tools and APIs for web scraping and data processing.
Language:Makefile6.8k 232 10790
bda-research/node-crawler
Web Crawler/Spider for NodeJS + server-side jQuery ;-)
Language:TypeScript6.7k 255 306876
BruceDone/awesome-crawler
A collection of awesome web crawler,spider in different languages
6.5k 201 19708
SpiderClub/haipproxy
:sparkling_heart: High available distributed ip proxy pool, powerd by Scrapy and Redis
Language:Python5.4k 206 98911
ihmily/DouyinLiveRecorder
可循环值守和多人录制的直播录制软件，支持抖音、TikTok、Youtube、快手、虎牙、斗鱼、B站、小红书、pandatv、sooplive、flextv、popkontv、twitcasting、winktv、百度、微博、酷狗、17Live、Twitch、Acfun、CHZZK、shopee等40+平台直播录制
Language:Python5.3k 37 817661
tophubs/TopList
今日热榜，一个获取各大热门网站热门头条的聚合网站，使用Go语言编写，多协程异步快速抓取信息，预览:https://mo.fish
Language:Go4.7k 107 76949
niespodd/browser-fingerprinting
Analysis of Bot Protection systems with available countermeasures 🚿. How to defeat anti-bot system 👻 and get around browser fingerprinting scripts 🕵️‍♂️ when scraping the web?
Language:JavaScript4.2k 69 9227
wechatsync/Wechatsync
一键同步文章到多个内容平台，支持今日头条、WordPress、知乎、简书、掘金、CSDN、typecho各大平台，一次发布，多平台同步发布。解放个人生产力
Language:JavaScript3.9k 34 105586
201206030/novel-plus
novel-plus 是一个多端（PC、WAP）阅读、功能完善的小说 CMS 系统。包括小说推荐、小说检索、小说排行、小说阅读、小说书架、小说评论、小说爬虫、会员中心、作家专区、充值订阅、新闻发布等功能。
Language:Java3.8k 56 01.3k
elliotgao2/toapi
Every web site provides APIs.
Language:Python3.5k 77 54235
Gerapy/Gerapy
Distributed Crawler Management Framework Based on Scrapy, Scrapyd, Django and Vue.js
Language:Python3.4k 125 215642
my8100/scrapydweb
Web app for Scrapyd cluster management, Scrapy log analysis & visualization, Auto packaging, Timer tasks, Monitor & Alert, and Mobile UI. DEMO :point_right:
Language:Python3.2k 73 194568
wkunzhi/Python3-Spider
Python爬虫实战 - 模拟登陆各大网站包含但不限于：滑块验证、拼多多、美团、百度、bilibili、大众点评、淘宝，如果喜欢请start ❤️
Language:Python3.1k 95 241k
Boris-code/feapder
🚀🚀🚀feapder is an easy to use, powerful crawler framework | feapder是一款上手简单，功能强大的Python爬虫框架。内置AirSpider、Spider、TaskSpider、BatchSpider四种爬虫解决不同场景的需求。且支持断点续爬、监控报警、浏览器渲染、海量数据去重等功能。更有功能强大的爬虫管理系统feaplat为其提供方便的部署及调度
Language:Python3k 37 170492
DedSecInside/TorBot
Dark Web OSINT Tool
Language:Python3k 104 104540
wnma3mz/wechat_articles_spider
微信公众号文章的爬虫
Language:Python2.9k 74 53728
JAVClub/core
🔞 JAVClub - 让你的大姐姐不再走丢
Language:JavaScript2.9k 105 32335
jumper2014/lianjia-beike-spider
链家网和贝壳网房价爬虫，采集北京上海广州深圳等21个**主要城市的房价数据（小区，二手房，出租房，新房），稳定可靠快速！支持csv,MySQL, MongoDB,Excel, json存储，支持Python2和3，图表展示数据，注释丰富，点星支持，仅供学习参考，请勿用于商业用途，后果自负。
Language:Python2.9k 94 42717
CharlesPikachu/DecryptLogin
DecryptLogin: APIs for loginning some websites by using requests.
Language:Python2.8k 61 79752
DormyMo/SpiderKeeper
admin ui for scrapy/open source scrapinghub
Language:Python2.7k 107 90508
shiyanhui/dht
BitTorrent DHT Protocol && DHT Spider.
Language:Go2.7k 123 59487
howie6879/owllook
owllook-小说搜索引擎
Language:Python2.7k 107 88755
jae-jae/QueryList
:spider: The progressive PHP crawler framework! 优雅的渐进式PHP采集框架。
Language:PHP2.7k 74 167443
geziyor/geziyor
Geziyor, blazing fast web crawling & scraping framework for Go. Supports JS rendering.
Language:Go2.6k 45 57151

spider

NaiboWang/EasySpider

gocolly/colly

jhao104/proxy_pool

shengqiangzhang/examples-of-web-crawlers

crawlab-team/crawlab

s0md3v/Photon

Evil0ctal/Douyin_TikTok_Download_API

ssssssss-team/spider-flow

guyueyingmu/avbook

kangvcar/InfoSpider

andeya/pholcus

luyishisi/Anti-Anti-Spider

lorien/awesome-web-scraping

bda-research/node-crawler

BruceDone/awesome-crawler

SpiderClub/haipproxy

ihmily/DouyinLiveRecorder

tophubs/TopList

niespodd/browser-fingerprinting

wechatsync/Wechatsync

201206030/novel-plus

elliotgao2/toapi

Gerapy/Gerapy

my8100/scrapydweb

wkunzhi/Python3-Spider

Boris-code/feapder

DedSecInside/TorBot

wnma3mz/wechat_articles_spider

JAVClub/core

jumper2014/lianjia-beike-spider

CharlesPikachu/DecryptLogin

DormyMo/SpiderKeeper

shiyanhui/dht

howie6879/owllook

jae-jae/QueryList

geziyor/geziyor