hery-168's Stars
apache/bahir-flink
Mirror of Apache Bahir Flink
hairless/plink
Platform for Flink
StarPlatinumStudio/FlinkAlarmOpsSys
This project used to monitoring log data stream, Manage alarm rules、alarm's threshold and frequency. based on Apache Flink、Spring Boot、Alibaba Nacos and JQuery.
MeetYouDevs/big-whale
Spark、Flink等离线任务的调度以及实时任务的监控
haoch/flink-siddhi
A CEP library to run Siddhi within Apache Flink™ Streaming Application (Not maintained)
alibaba/Alink
Alink is the Machine Learning algorithm platform based on Flink, developed by the PAI team of Alibaba computing platform.
wangzheng0822/algo
数据结构和算法必知必会的50个代码实现
CyC2018/CS-Notes
:books: 技术面试必备基础知识、Leetcode、计算机操作系统、计算机网络、系统设计
ShichenXie/scorecard
Scorecard Development in R, 评分卡
delta-io/delta
An open-source storage framework that enables building a Lakehouse architecture with compute engines including Spark, PrestoDB, Flink, Trino, and Hive and APIs
allwefantasy/spark-submitter-console
A web application for submitting spark application
allwefantasy/spark-binlog
A library for querying Binlog with Apache Spark structure streaming, for Spark SQL , DataFrames and [MLSQL](https://www.mlsql.tech).
hankcs/HanLP
中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
oeljeklaus-you/UserActionAnalyzePlatform
电商用户行为分析大数据平台
apache/seatunnel
SeaTunnel is a next-generation super high-performance, distributed, massive data integration tool.
scutan90/DeepLearning-500-questions
深度学习500问,以问答形式对常用的概率知识、线性代数、机器学习、深度学习、计算机视觉等热点问题进行阐述,以帮助自己及有需要的读者。 全书分为18个章节,50余万字。由于水平有限,书中不妥之处恳请广大读者批评指正。 未完待续............ 如有意合作,联系scutjy2015@163.com 版权所有,违权必究 Tan 2018.06
flink-china/flink-forward-china-2018
Flink Forward China 2018 Slides
DTStack/chunjun
A data integration framework
DTStack/flinkStreamSQL
基于开源的flink,对其实时sql进行扩展;主要实现了流与维表的join,支持原生flink SQL所有的语法
Vonng/ddia
《Designing Data-Intensive Application》DDIA中文翻译
apache/flink
Apache Flink
alibaba/DataX
DataX是阿里云DataWorks数据集成的开源版本。
MLjian/TextClassificationImplement
’达观杯‘文本智能处理挑战赛,文本分类任务的实现,包括一些传统的监督学习算法和深度学习算法,主要基于sklearn/xgb/lgb/pytorch包实现。
egonSchiele/grokking_algorithms
Code for the book Grokking Algorithms (https://www.amazon.com/dp/1633438538)
LuckyZXL2016/News_Spark
基于Spark2.x新闻网大数据实时分析可视化系统项目
LuckyZXL2016/Movie_Recommend
基于Spark的电影推荐系统,包含爬虫项目、web网站、后台管理系统以及spark推荐系统
NLPchina/ansj_seg
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
mlflow/mlflow
Open source platform for the machine learning lifecycle
LeechanX/Netflix-Recommender-with-Spark
基于Apache Spark的Netflix电影的离线与实时推荐系统
gongbp/scala-in-practice
通过实例来演示Scala中的各种特性!