hohho's Stars
oxford-cs-deepnlp-2017/lectures
Oxford Deep NLP 2017 course
gaussic/text-classification-cnn-rnn
CNN-RNN中文文本分类,基于TensorFlow
lucasjinreal/tensorflow_poems
中文古诗自动作诗机器人,x炸天,基于tensorflow1.10 api,正在积极维护升级中,快star,保持更新!
Loopring/whitepaper
This is the whitepaper for Loopring protocol 1.0, 1.5, and 2.0.
yuki-lau/weibo-spider
新浪微博爬虫,采用Java语言开发,基于HTTPClient 4.0,采用MySQL存储爬取数据,支持多进程并发执行。功能包括:爬取微博、评论、转发、关注列表(层次)。根据数据需求,持续更新...
jobbole/awesome-javascript-cn
JavaScript 资源大全中文版,内容包括:包管理器、加载器、测试框架、运行器、QA、MVC框架和库、模板引擎等。由「开源前哨」和「前端大全」微信公号团队维护更新。
bluejoe2008/openwebflow
基于Activiti的工作流引擎扩展,接管了Activiti对活动权限以及用户表的管理,并提供了催办、代办、加签(包括前加签/后加签)、自由跳转、分裂节点等功能
PkuJavaGroupCzz/Distributed_spider_pku_java
1. 主要分为三个模块,一个爬虫抓取模块,一个是数据处理模块,一个是用户模块。 2. 爬虫抓取模块主要是从直播吧、新浪体育、网易体育上爬取有关足球的新闻和用户关于足球的评论,利用集群HADOOP抓取网页,分析得出URL集,提取特征URL 3. 网页linux脚本过滤得到原始网页,然后二次过滤得到文本,并使用分布式储存。 4. 处理模块主要是根据训练集规则一和规则二,得到分词器,然后对文本进行操作,得出训练结果。 5. 通过特征脚本得到训练结果的特征词分类,然后提取出球队模糊集和球星模糊集。 6. 过滤得到球队精确集和球星精确集,并存入MYSQL数据库。 7. 从数据库中提取球星和球队的信息进行图表分析,并动态显示WIKI信息,调入显示模块中和用户进行交换
xtuhcy/gecco
Easy to use lightweight web crawler(易用的轻量化网络爬虫)
google/python-fire
Python Fire is a library for automatically generating command line interfaces (CLIs) from absolutely any Python object.
huaxz1986/git_book
教材对应的源码
LiuXingMing/SinaSpider
新浪微博爬虫(Scrapy、Redis)
tensorflow/tensorflow
An Open Source Machine Learning Framework for Everyone
yxfanxiao/zhihu
仿の知乎Web。