wormhole: A JavaScript repository from yanghua

Mailing list: edp_support@groups.163.com
WeChat: edpstack <a target="_blank" rel="nofollow" href="https://github.com/edp963/edp-resource/raw/master/WeChat.jpg"><img src="https://github.com/edp963/edp-resource/raw/master/WeChat.jpg?raw=true" alt="" width="100" style="max-width: 100%;" loading="lazy">

Wormhole

来自宜信技术研发中心的流式处理平台

Wormhole 是一个一站式流式处理云平台解决方案（SPaaS - Stream Processing as a Service）。

Wormhole 面向大数据流式处理项目的开发管理运维人员，致力于提供统一抽象的概念体系，直观可视化的操作界面，简单流畅的配置管理流程，基于 SQL 即可完成的业务逻辑开发方式，并且屏蔽了流式处理的底层技术细节，极大的降低了数据项目管理运维门槛，使得大数据流式处理项目的开发管理运维变得更加轻量敏捷可控可靠。

Documentation

Please refer to Wormhole用户手册.

Architecture

设计理念

统一 DAG 高阶分形抽象
- 构建由 Source DataSys，Kafka Topic，Spark Stream（Flink Stream），Sink DataSys 组成的物理 DAG
- 每个物理 DAG 里可以并行处理多个由 Source Namespace，Flow，Sink Namespace 组成的逻辑 DAG
- 每个 Flow 本身是典型的 Spark RDD DAG
统一通用流消息 UMS 协议抽象
- UMS 是 Wormhole 定义的流消息协议规范
- UMS 试图抽象统一所有结构化消息
- UMS 自身携带结构化数据 Schema 信息
- Wh4 支持用户自定义半结构化 JSON 格式
统一数据逻辑表命名空间 Namespace 抽象
- Namespace 唯一定位所有数据存储所有结构化逻辑表
- [Data System].[Instance].[Database].[Table].[Table Version].[Database Partition].[Table Partition]