Pinned Repositories
aliMusic
天池阿里音乐流行趋势预测大赛,项目中涵盖了从初赛到复赛的全部核心代码。复赛的聚合数据可以在百度网盘下载,更详细的思路介绍欢迎访问我的博客。
ASO
多牛Spark平台开发的ASO项目 ASO的数据是苹果手机用户在AppStore上的排行列表,根据爬虫爬取数据,存储到Kafka接着到Hbase,最后通过Spark计算,结果存储到Hbase
Backquarter
易观开源大数据互联网百亿级记录互传Backquarter项目
BaiduCrawler
百度爬虫+代理
BI-Analysis
SpringMVC+mybaits+Maven+anguljs+html5+mysql+nodejs+BO报表 集成的大数据地产分析项目
BigData
BigData Project 大数据项目由浅入深
bigtable-sql
分布式大数据SQL查询可视化界面! 大数据版的navcat
CanalX
基于 `Canal` 的数据感知服务框架. 可用于围绕数据库`Mysql`进行数据相关的各式业务开发, 并建立各式各样的服务平台.
CaptuocrToy
A tool to capture screenshot and recognize text by online ocr apis
open_source_team
国内顶尖团队的开源地址
longhuohuo's Repositories
longhuohuo/BigData
BigData Project 大数据项目由浅入深
longhuohuo/CanalX
基于 `Canal` 的数据感知服务框架. 可用于围绕数据库`Mysql`进行数据相关的各式业务开发, 并建立各式各样的服务平台.
longhuohuo/CaptuocrToy
A tool to capture screenshot and recognize text by online ocr apis
longhuohuo/catcher
java性能采集工具
longhuohuo/cobar
a proxy for sharding databases and tables
longhuohuo/Corgi
Corgi 柯基:MySQL 到 Hive 批量数据集成服务
longhuohuo/datax-web
datax web
longhuohuo/flink-runtime-web
longhuohuo/flink-training-exercises
longhuohuo/flinkStreamSQL
基于开源的flink,对其实时sql进行扩展;主要实现了流与维表的join,支持原生flink SQL所有的语法
longhuohuo/flinkx
基于flink的分布式同步工具
longhuohuo/hdfsreader
parquet for DataX - hdfsreader
longhuohuo/hxyFrame
hxyFrame是一个OA办公系统,采用流行的框架springMvc+spring+mybatis+shiro+ehcache开发,还集成了权限管理(菜单权限、数据权限),完善的代码生成器,solr全文搜索引擎,activiti工作流程引擎,cas单点登陆等功能,后期还会考虑改造成Dubbo微服务化,做到模块的相对独立,使用更加灵活,努力做到快速开发OA办公系统。 感兴趣可以Watch、Start持续关注项目最新状态,加入QQ群:210315502 大家一起学习开发解决问题。
longhuohuo/ip2region
准确率99.9%的ip地址定位库,0.0x毫秒级查询,数据库文件大小只有1.5M,提供了java,php,c,python,nodejs,golang查询绑定和Binary,B树,内存三种查询算法,妈妈再也不用担心我的ip地址定位!
longhuohuo/JavaGuide
【Java学习+面试指南】 一份涵盖大部分Java程序员所需要掌握的核心知识。
longhuohuo/jfilebeat
类filebeat的轻量级日志采集工具
longhuohuo/jieba-analysis
结巴分词(java版)
longhuohuo/jvm-profiler
追踪任意的 Java 方法和用户代码上的参数,而不需要用户代码更改。 该特性可用于追踪每个 Spark 应用程序的 HDFS 名称节点调用延迟,并识别名称节点的瓶颈。 它还可以跟踪 HDFS 文件路径,每个 Spark 应用程序读取或写入并识别热文件以便进一步优化
longhuohuo/kafka-spark-streaming
An example project for Kafka and Spark Streaming integration
longhuohuo/KafkaOffsetMonitor
A little app to monitor the progress of kafka consumers and their lag wrt the queue.
longhuohuo/mdrill
for千亿数据即席分析
longhuohuo/oh-my-zsh
一种shell的项目 A delightful community-driven (with 1,000+ contributors) framework for managing your zsh configuration. Includes 200+ optional plugins (rails, git, OSX, hub, capistrano, brew, ant, php, python, etc), over 140 themes to spice up your morning, and an auto-update tool so that makes it easy to keep up with the latest updates from the community.
longhuohuo/planA
基于mongodb+spark的大数据项目
longhuohuo/prophet
一个优秀的大数据查询平台,提供hive异步任务查询、LDAP用户、数据权限控制、历史查询任务与结果存储、邮件通知、excel下载等功能。
longhuohuo/pyecharts
Echarts+Python 实现的一个用于生成 Echarts 图表的类库
longhuohuo/spark2.2-maven
慕课网sparkstreaming项目实战
longhuohuo/spring-boot-adminlte
A Spring Boot AdminLTE
longhuohuo/streamingpro
Build big Data processing and Machine Learning platform with MLSQL
longhuohuo/structuredstreamingkafkapyspark
Apche Spark Structured Streaming with Kafka using Python(PySpark)
longhuohuo/uirecorder
UI Recorder is a UI test case recorder like Selenium IDE.