Pinned Repositories
1book
《Web安全之机器学习入门》
Ad-papers
Papers on Computational Advertising
ad_dsp_processing
the bigdata processing of ad
AdaptiveStorm
研究内容:利用机器学习使得Storm自适应调整参数,后端部分
Administrative-divisions-of-China
中华人民共和国行政区划:省级(省份直辖市自治区)、 地级(城市)、 县级(区县)、 乡级(乡镇街道)、 村级(村委会居委会) ,中国省市区镇村三级四级五级联动地址数据。
AdRealTimeAnalysis
四川大学拓思艾诺广告流量实时分析项目
akka-guide-zh
akka 中文文档,通过官方文档翻译
Algorithm_Interview_Notes-Chinese
2018/2019/校招/春招/秋招/算法/机器学习(Machine Learning)/深度学习(Deep Learning)/自然语言处理(NLP)/C/C++/Python/面试笔记
ArchSummit
ArchSummit全球架构师峰会
bigdata-sql-parser
基于antlr4 解析器,支持spark sql, tidb sql, flink sql, Spark/flink jar 运行命令解析器
DrtJordan's Repositories
DrtJordan/akka-guide-zh
akka 中文文档,通过官方文档翻译
DrtJordan/Big-Data-Resources
大数据/数据挖掘/推荐系统/机器学习相关资源
DrtJordan/cipher
基于hdfs spark的视频非结构化数据计算
DrtJordan/demo_11.11_storm-spark-hadoop
hadoop_storm_spark结合实验的例子,模拟淘宝双11节,根据订单详细信息,汇总出总销售量,各个省份销售排行,以及后期的SQL分析,数据分析,数据挖掘等。 --------大概流程------- 第一阶段(storm实时报表) 第二阶段(离线报表)第三阶段(大规模订单即席查询,和多维度查询) 第四阶段(数据挖掘和图计算)
DrtJordan/distribute_crawler
使用scrapy,redis, mongodb,graphite实现的一个分布式网络爬虫,底层存储mongodb集群,分布式使用redis实现,爬虫状态显示使用graphite实现
DrtJordan/DW
数据仓库应用
DrtJordan/fp-growth
推荐系统FP-Growth算法实现
DrtJordan/free-programming-books-zh_CN
免费的计算机编程类中文书籍,欢迎投稿
DrtJordan/gd_traffic_tc_python
阿里天池,广东公共交通大数据竞赛,简单实践,主要涉及特征提取,特征选择,scikit-learn使用
DrtJordan/hadoop-maven
Hadoop生态系统学习练习,包括hdfs,mr,hbase,hive,storm等
DrtJordan/HadoopProject01
TODO: NET文件、POSITION文件,Data文件作为输入,计算十点以前和十点以后的用户停留基站。
DrtJordan/maven_mahout_template
DrtJordan/MR_HBase
hadoop中Map/Reduce使用示例,输入(DBInputFormat),输出(DBOutputFormat)为MySql数据库表、日志分析Grep、单词排序Sort...对HBase的基本操作,增、删、查、改,使用Map/Reduce批量导入数据到HBase表中...
DrtJordan/second_bigdata
第二届全国大数据比赛-个性化新闻推荐
DrtJordan/spark-mongodb-connector
A prototype native MongoDB connector for Apache Spark, using Spark's external datasource API
DrtJordan/spider
使用java+httpclient+httpcleaner,多线程、分布式爬去电商网站商品信息,数据存储在hbase上,并使用solr对商品建立索引,使用redis队列存储一个共享的url仓库;使用zookeeper对爬虫节点生命周期进行监视等。
DrtJordan/storm-sentiment
基于Storm的與请分析
DrtJordan/storm-trident
《Storm Blueprints: Patterns for Distributed Real-time Computation 》一书的源码和翻译
DrtJordan/SVM-DataProcess
svm文本处理的数据预处理过程。
DrtJordan/tianchi_bigdata
阿里2015年天池大数据比赛,采用移动窗口采样加随机森林学习