/SparkToParquet

当有持续不断的结构化或非结构化大数据集以流(streaming)的方式进入分布式计算平台,能够保存在大规模分布式存储上,并且能够提供准实时SQL查询,这个系统多少人求之不得。

Primary LanguageJavaApache License 2.0Apache-2.0

Watchers