hohho

hohho's Stars

oxford-cs-deepnlp-2017/lectures
Oxford Deep NLP 2017 course
15.6k3.6k
gaussic/text-classification-cnn-rnn
CNN-RNN中文文本分类，基于TensorFlow
Language:Python4.1k1.5k
lucasjinreal/tensorflow_poems
中文古诗自动作诗机器人，x炸天，基于tensorflow1.10 api，正在积极维护升级中，快star，保持更新！
Language:Python3.6k936
Loopring/whitepaper
This is the whitepaper for Loopring protocol 1.0, 1.5, and 2.0.
Language:TeX6848
yuki-lau/weibo-spider
新浪微博爬虫，采用Java语言开发，基于HTTPClient 4.0，采用MySQL存储爬取数据，支持多进程并发执行。功能包括：爬取微博、评论、转发、关注列表（层次）。根据数据需求，持续更新...
Language:Java352222
jobbole/awesome-javascript-cn
JavaScript 资源大全中文版，内容包括：包管理器、加载器、测试框架、运行器、QA、MVC框架和库、模板引擎等。由「开源前哨」和「前端大全」微信公号团队维护更新。
7.7k2k
bluejoe2008/openwebflow
基于Activiti的工作流引擎扩展，接管了Activiti对活动权限以及用户表的管理，并提供了催办、代办、加签（包括前加签/后加签）、自由跳转、分裂节点等功能
Language:Java944515
PkuJavaGroupCzz/Distributed_spider_pku_java
1. 主要分为三个模块，一个爬虫抓取模块，一个是数据处理模块，一个是用户模块。 2. 爬虫抓取模块主要是从直播吧、新浪体育、网易体育上爬取有关足球的新闻和用户关于足球的评论，利用集群HADOOP抓取网页，分析得出URL集，提取特征URL 3. 网页linux脚本过滤得到原始网页，然后二次过滤得到文本，并使用分布式储存。 4. 处理模块主要是根据训练集规则一和规则二，得到分词器，然后对文本进行操作，得出训练结果。 5. 通过特征脚本得到训练结果的特征词分类，然后提取出球队模糊集和球星模糊集。 6. 过滤得到球队精确集和球星精确集，并存入MYSQL数据库。 7. 从数据库中提取球星和球队的信息进行图表分析，并动态显示WIKI信息，调入显示模块中和用户进行交换
Language:Java159104
xtuhcy/gecco
Easy to use lightweight web crawler（易用的轻量化网络爬虫）
Language:Java2.5k890
google/python-fire
Python Fire is a library for automatically generating command line interfaces (CLIs) from absolutely any Python object.
Language:Python26.9k1.4k
huaxz1986/git_book
教材对应的源码
Language:Jupyter Notebook314264
LiuXingMing/SinaSpider
新浪微博爬虫（Scrapy、Redis）
Language:Python3.3k1.5k
tensorflow/tensorflow
An Open Source Machine Learning Framework for Everyone
Language:C++185k74.2k
yxfanxiao/zhihu
仿の知乎Web。
Language:JavaScript8428