在数据仓库建设中,经常会使用到数据血缘追中方面的功能,本项目实现了对hql集合进行静态分析,获取hql对应的血缘图(表血缘 + 字段血缘)
- 删除hive-exec与hadoop-common的maven依赖,使得项目更加的轻量级。
- 重构项目代码,优化解析,修复无字段血缘时,不能获取表血缘的BUG。
- 规范化接口输入输出,血缘图均为自定义实体,方便进行JSON序列化。
- 新增接口层,方便Spring的注入,同时也提供静态方式调用。
引入JDBC获取元数据信息,使血缘图更加丰富,同时可以解决Sql中有select * 的问题。
请关注test下的HiveBloodEngineTest与HiveSqlBloodFactoryTest。
接口类:HiveBloodEngine,实现类:HiveBloodEngineImpl。(spring接入)
工具类:HiveSqlBloodFactory。(静态调用)
结果:
感谢 xiaoju 提供的代码贡献。