Pinned Repositories
30min_guides
覃健祥的学习笔记,各种几十分钟入门的文档
cfg-note
Linux系统常用配置笔记,非项目,包含网络、基本工具、环境变量、Jdk、Scala、Tomcat、Nginx、MySQL、MariaDB、PostgreSQL、Redis、Hadoop、Docker的配置
docker
Docker 笔记
docker-1
docker学习笔记
handbook
放置我的笔记、搜集、摘录、实践,保持好奇心。看文需谨慎,后果很严重。
harbour-sailfishclub
SailfihsOS client for https://sailfishos.club
openwrt-shadowsocks
Shadowsocks-libev for OpenWrt/LEDE
phpspider
《我用爬虫一天时间“偷了”知乎一百万用户,只为证明PHP是世界上最好的语言 》所使用的程序
shell-scripts
运维通用的shell脚本
slackbook_cn
Chinese version of Slackbook
alpharootbeta's Repositories
alpharootbeta/LianJiaSpider
链家爬虫
alpharootbeta/rssSpider
Rss spider by nodejs , rss 爬虫,正文抓取
alpharootbeta/Simple-Computer-Robot
当初为某个站长编写的爬虫,可以用来爬去优酷视频,电影天堂,搜狗等站的资源,采用多线程,可以在配置文件里面给定关键词,数据库配置信息等,自动更新到极光cms中(现在好像找不到了).所以此代码只给想要学习用python编写爬虫的同学学习
alpharootbeta/vpsinfo
VPSinfo is a Linux server monitoring script, written in PHP, that provides web access to system status information.
alpharootbeta/30min_guides
覃健祥的学习笔记,各种几十分钟入门的文档
alpharootbeta/Reverse_DNS_Shell
A python reverse shell that uses DNS as the c2 channel
alpharootbeta/Google-Web-Search-Crawler
Crawl Google web search result and get text from the url that google give us
alpharootbeta/CnkiSpider
**知网爬虫
alpharootbeta/Distributed_spider_pku_java
1. 主要分为三个模块,一个爬虫抓取模块,一个是数据处理模块,一个是用户模块。 2. 爬虫抓取模块主要是从直播吧、新浪体育、网易体育上爬取有关足球的新闻和用户关于足球的评论,利用集群HADOOP抓取网页,分析得出URL集,提取特征URL 3. 网页linux脚本过滤得到原始网页,然后二次过滤得到文本,并使用分布式储存。 4. 处理模块主要是根据训练集规则一和规则二,得到分词器,然后对文本进行操作,得出训练结果。 5. 通过特征脚本得到训练结果的特征词分类,然后提取出球队模糊集和球星模糊集。 6. 过滤得到球队精确集和球星精确集,并存入MYSQL数据库。 7. 从数据库中提取球星和球队的信息进行图表分析,并动态显示WIKI信息,调入显示模块中和用户进行交换
alpharootbeta/SendEmailByPython
使用python语言编写的邮件群发程序,可发送文字及HTML格式邮件,电子邮件地址存在于MYSQL数据库中,由爬虫从互联网中爬取得到
alpharootbeta/pycrawler
一个使用Python编写的爬虫,目标是让用户以最简单的方式就可以获得需要的网络数据。