DataLink

DataLink是一个满足各种异构数据源之间的实时增量同步，分布式、可扩展的数据交换平台。

项目背景

着眼于未来，我们的目标是打造一个平台，满足各种异构数据源之间的实时增量同步，支撑公司业务的快速发展。在充分调研的基础之上，我们发现，没有任何一款开源产品能轻易的满足我们的目标，每个产品都有其明显的短板和局限性，所以最终的选项只有"自行设计"。但自行设计并不是凭空设计，现有的数据交换平台、已有的经验、大大小小的开源产品都是我们的设计根基，与其说是自行设计，倒不如说是站在巨人的肩膀上做了一次飞跃。由此诞生了DataLink这样一个产品：

满足各种异构数据源之间的实时增量同步
平台提供统一的基础设施（高可用、动态负载、同步任务管理、插件管理、监控报警、公用业务组件等等），让设计人员专注于同步插件开发，一次投入，长久受益
吸收、整合业内经验，在架构模型、设计方法论、功能特性、可运维、易用性上进行全面的升级，在前瞻性和扩展性上下足功夫，满足未来5-10年内的各种同步需求

DataLink开发时间从2016年12月开始，第一版于2017年5月份上线，在神州优车集团服役到现在，基本上满足了公司所有业务线的同步需求。此次外部开源版本为去除内部依赖后的版本。

目前同步规模：

同步数据量360亿+
涉及272个数据库实例之间的3208个同步映射
60台Worker+2台Manager机器的集群规模

项目介绍

名称：DataLink['deitə liŋk]

译意：数据链路，数据（自动）传输器

语言：纯java开发

定位：完成各种异构数据源之间的实时增量同步，一个分布式、可扩展的数据库同步系统

工作原理

原理描述：

典型管理系统架构，Manager(Web管理)+Worker(工作节点)
a. Manager负责worker的负载均衡、集群的配置管理和系统监控
b. Worker核心功能是管理Task的生命周期，并配合Manager进行Re-Balance
Zookeeper：Manager的高可用需要依赖于Zookeeper，另外，Task会将运行时信息注册到Zookeeper
Mysql：Datalink的运行需要依赖各种配置信息、以及在运行过程中会动态产生监控和统计数据，统一保存到Mysql中

QuickStart

See the page for quick start: QuickStart

架构&文档

See the page for introduction: 架构&文档

常见问题

See the page for FAQ: FAQ

问题反馈

目前有关DataLink的问题交流方式有如下几种，欢迎各位加入进行技术讨论。
qq交流群： 758937055
邮件交流： tech_plat_data@ucarinc.com
报告issue：issues

【招聘信息】
优车集团大数据平台团队常年招人，欢迎投递简历
投递邮箱:biao.lu@ucarinc.com
QQ联系:634659517
岗位职责
	• 主要参与神州优车集团大数据平台相关产品的研发
	• 按照需求，完成产品的设计、开发和维护工作，并根据规范编写产品设计和使用文档
	• 持续梳理和优化系统，构建可扩展、高并发、高可用的产品，以适应公司业务的高速发展
岗位要求
	• 3年以上互联网服务端开发经验 
	• 计算机基础扎实，熟悉常用的数据结构和算法，深入掌握操作系统、数据库、网络等基础知识
	• Java基础扎实, 深入掌握IO、多线程、集合、jvm等基础知识，深入掌握MVC、IoC、ORM、RPC等主流框架
	• 深入理解面向对象**和常用设计模式，注重代码质量，有工匠精神和重构精神
	• 热爱技术研发，具有快速学习能力，有良好的软件工程知识和编码规范意识
	• 具有较好的沟通能力、思路清晰、善于思考、能独立分析和解决问题
	• 对数据库分片及数据同步有实践经验者优先
	• 有大数据平台(hadoop)研发经验者优先
	• 有互联网大型系统开发经验优先 
	• 有贡献或研读过开源代码者优先

yqbboy/DataLink