Pinned Repositories
seatunnel
SeaTunnel is a next-generation super high-performance, distributed, massive data integration tool.
bishe2
react+springboot视频网站
datax-rpc
主要提供datax的微服务调用实现,以及实时上报每个节点job运行状态及job结束后结果数据的上报
DeepLearning-21-Examples
fink
PatentCrawler
recommendSys
推荐项目(实时推荐和离线推荐)
seatunnel
SeaTunnel is a next-generation super high-performance, distributed, massive data integration tool.
semantic-segmentation-pytorch
sprintboot-vue-weixin
dailai's Repositories
dailai/BinlogAnalysis
解析Mysql binlog日志并发至Kafka
dailai/mypumpkin
把mysqldump封装成并发导出,同时可并发导入
dailai/-
dailai/caffe-1
Caffe: a fast open framework for deep learning.
dailai/RiskControl
dailai/ng-showcase
Angular指令及组件的全面范例
dailai/DigAndBuried
挖坑与填坑
dailai/vqa-mcb
dailai/ConGD-Baseline-Method
dailai/IsoGD-Baseline-Method
dailai/MyBatis_Study
MyBatis学习的源码,博客地址:http://blog.csdn.net/column/details/smybatis.html
dailai/Caffe
dailai/cuda-convnet
Automatically exported from code.google.com/p/cuda-convnet
dailai/cuda-convnet2
dailai/cvpr16-deepbit
Learning Compact Binary Descriptors with Unsupervised Deep Neural Networks (CVPR16)
dailai/mammuthus-yarn-docker-scheduler
基于Yarn的容器调度引擎(container scheduler based on yarn)
dailai/mammuthus-nginx
提供Rest API操作Nginx 配置文件
dailai/image_retrieval
Image retrieval system demo based on caffe and lsh
dailai/Distributed_spider_pku_java
1. 主要分为三个模块,一个爬虫抓取模块,一个是数据处理模块,一个是用户模块。 2. 爬虫抓取模块主要是从直播吧、新浪体育、网易体育上爬取有关足球的新闻和用户关于足球的评论,利用集群HADOOP抓取网页,分析得出URL集,提取特征URL 3. 网页linux脚本过滤得到原始网页,然后二次过滤得到文本,并使用分布式储存。 4. 处理模块主要是根据训练集规则一和规则二,得到分词器,然后对文本进行操作,得出训练结果。 5. 通过特征脚本得到训练结果的特征词分类,然后提取出球队模糊集和球星模糊集。 6. 过滤得到球队精确集和球星精确集,并存入MYSQL数据库。 7. 从数据库中提取球星和球队的信息进行图表分析,并动态显示WIKI信息,调入显示模块中和用户进行交换
dailai/shell
我在unix/linux下积累的常用工具
dailai/tb_tddl