wistwill

wistwill's Stars

eip-work/kuboard-press
Kuboard 是基于 Kubernetes 的微服务管理界面。同时提供 Kubernetes 免费中文教程，入门教程，最新版本的 Kubernetes v1.23.4 安装手册，(k8s install) 在线答疑，持续更新。
Language:JavaScript23k 204 5381.5k
alibaba/DataX
DataX是阿里云DataWorks数据集成的开源版本。
Language:Java16.2k 453 1.6k5.5k
wangzhiwubigdata/God-Of-BigData
专注大数据学习面试，大数据成神之路开启。Flink/Spark/Hadoop/Hbase/Hive...
9.9k 332 03.2k
StarRocks/starrocks
The world's fastest open query engine for sub-second analytics both on and off the data lakehouse. With the flexibility to support nearly any scenario, StarRocks provides best-in-class performance for multi-dimensional analytics, real-time analytics, and ad-hoc queries. A Linux Foundation project.
Language:Java9.4k 190 8.1k1.9k
apache/seatunnel
SeaTunnel is a next-generation super high-performance, distributed, massive data integration tool.
Language:Java8.2k 176 3.7k1.9k
JSQLParser/JSqlParser
JSqlParser parses an SQL statement and translate it into a hierarchy of Java classes. The generated hierarchy can be navigated using the Visitor Pattern
Language:Java5.5k 218 1.5k1.4k
apache/calcite
Apache Calcite
Language:Java4.7k 167 02.4k
DTStack/chunjun
A data integration framework
Language:Java4k 167 1.2k1.7k
DataLinkDC/dinky
Dinky is a real-time data development platform based on Apache Flink, enabling agile data development, deployment and operation.
Language:Java3.3k 40 1.6k1.2k
birdLark/LarkMidTable
LarkMidTable 是一站式开源的数据中台，实现中台的基础建设，数据治理，数据开发，监控告警，数据服务，数据的可视化，实现高效赋能数据前台并提供数据服务的产品。
Language:Java1.9k 64 60579
uber/queryparser
Parsing and analysis of Vertica, Hive, and Presto SQL.
Language:Haskell1.1k 57 36147
realguoshuai/hadoop_study
定期更新Hadoop生态圈中常用大数据组件文档重心依次为: Flink Solr Sparksql ES Scala Kafka Hbase/phoenix Redis Kerberos (项目包含hadoop思维导图印象笔记 Scala版本简单demo 常用工具类去敏后的train code 持续更新!!!)
Language:Java926 41 11260
threeknowbigdata/flink_second_understand
该仓库专注于让读者秒懂Flink组件，包含Flink实战代码和文档、200个Flink教程知识点，Flink Datastream、Flink Table、Flink Window、Flink State、Flink Checkpoint、Flink Metrics、Flink Memory、Flink on standalone /yarn/k8s、Flink SQL、Flink CEP、Flink CDC、Flink UDF、PyFlink、Flink新特性、Flink Partition、Flink Memory等知识点。详细链接请看：https ://mp.weixin.qq.com/mp /appmsgalbum?__biz=Mzg5NDY3NzIwMA==&action=getalbum&album_id=2038088622687469575#wechat_redirect
Language:Java712 11 0195
Mrkuhuo/data-warehouse-learning
【2024最新版】大数据数据分析电商系统实时数仓离线数仓数据湖建设方案及实战代码，涉及组件 #flink #paimon #doris #seatunnel #dolphinscheduler #datart #dinky #hudi #iceberg。
Language:Java684 5 2104
bage2014/study
Java全栈工程师学习笔记；Spring、shiro、CAS、oauth2单点登录；cache 、Redis; web 安全及解决思路；redis、mq、quartz、docker；Docker各种组件实践等；mybatis、spring、spring boot实践；分布式锁；基于分库分表等等；Java full-stack engineer study notes; Spring, shiro, CAS, oauth2 single sign-on; cache, Redis; web security and solutions; redis, mq, quartz, docker; Docker various component practices, etc.;
Language:Java513 17 2101
642933588/jiron-cloud
该项目整合了多款优秀的开源产品，构建了一个功能全面的数据开发平台。平台提供了强大的数据集成、数据开发、数据查询、数据服务、数据质量管理、工作流调度和元数据管理功能。#dinky #dolphinscheduler #datavines #flinkcdc #openmetadata #flink #数据开发 #数据平台 # 数据开发平台 #大数据
Language:Java347 5 3102
Thpffcj/BigData-Getting-Started
大数据相关框架实战项目(Hadoop, Spark, Storm, Flink)
Language:Java316 7 075
zbwfisher1/vue-metadata
元数据管理系统（leap metadata）是用于企业内进行元数据管理的Web应用程序。该系统提供直观的用户页面。用户可以使用该系统管理企业所拥有的元数据，如查看元数据基本信息、数据所在位置、数据的血缘关系等。本系统支持管理员和普通用户的分级操作。
Language:Vue281 9 0192
hortonworks-spark/spark-atlas-connector
A Spark Atlas connector to track data lineage in Apache Atlas
Language:Scala266 20 168149
dromara/dataCompare
big data comparison and data profiling platform: low code，data comparison and data profiling
Language:Java261 7 760
neo4j-contrib/neo4j-etl
Data import from relational databases to Neo4j.
Language:HTML216 38 9547
apache/dolphinscheduler-website
Apache DolphinScheduler website
Language:JavaScript133 21 0214
thestyleofme/data-lineage-parent
数据血缘，Hive/Sqoop/HBase/Spark等，发送到kafka后，解析处理使用neo4j生成血缘
Language:Java81 5 151
bill-cc/metadata-hive-hook
Hive hook, obtain task information from Hive, fetch input/output tables and lineage information from HSQL.
Language:Java39 3 322
InterestingLab/seatunnel-example
seatunnel plugin developing examples.
Language:Scala35 5 116
NCEAS/metacat
Data repository software that helps researchers preserve, share, and discover data
Language:Java28 16 1.7k13
jeffytang/spark-atlas-listener
Spark SQL 元数据管理
Language:Scala5 1 12
liweijin1020/spring-boot-docker
docker部署Spring Boot应用
Language:Java3 1 00
wistwill/Ryven
Flow-based visual scripting for Python
Language:Python1 1 00
wistwill/sql_analysis
基于jsqlparser 进行sql语句解析，得到字段间的血缘关系（即所查询字段来源于哪张表中的哪个字段）
Language:Java1 1 00