/spark-util

spark kafka ; spark-kafka ; spark es ; spark kudu;spark hbase;flink kafka;rabbitmq util;spark使用低阶方法读取kafka数据,同时提供offset管理方法。etc..

Spark-Util

大数据生态中有许多的组件,spark作为大数据的主流技术,在实际开发中spark会经常更其他组件进行结合开发。但是spark官方没有响应的工具包来支持。 这里主要是自己封装了一些常用的组件与spark结合。对于一些简单需求,或者新手来说可能比较适合。以下代码全部在生产线上使用过了并且稳定运行。bug的话暂时没发现。如果你使用过程中有发现什么bug或者有新的idea,可以留言------LinMingQiang
language : Scala
Scala   : 2.10
Kafka   :0.8.0+
Spark   : 1.3.0+
Hbase   : 1.0.0+

Spark Kafka Util

  • sparkstreaming 使用 direct方式读取kafka,不需要自己在手动维护offset。已经封装好了。提供许多配置参数来控制读取kafka数据的方式
  • 支持spark 1.3+ 和 kafka 0.8+
  • 封装了许多使用的方法。
    https://github.com/LinMingQiang/spark-util/tree/spark-kafka

Spark Hbase Util

Spark ES Util  

Spark Kudu  

Splunk  

flink kafka

Kafka Util

Hbase Util

database-util

es shade

rabbitmq util