/hadoop_study

一起学习hadoop生态圈下常用大数据组件 已有 Flink Kafka Hbase Scala Solr (项目包含hadoop思维导图 印象笔记 Scala版本简单demo 工具类 持续更新!!!)

Primary LanguageJava

hadoop

How Study

hadoop 导图笔记

hive

Scala

Flink

Spark

SparkStreaming

Spark Structured Streaming

HBase(phoenix)

kafka

Eleasticsearch

  • 占坑,可以直接使用dbms+es实现几千万数据可视化展示 汇总,底层跟solr一样,都是基于lucene

solr

redis

kerberos

  • 这个真恶心 人机/机机
  • 2019-5-5 更新 Fusioninsigh下的所有组件互通已经调试好

springboot

  • 用空还是要学一下 最近做了个springboot实现solr rest服务 套的公司应用层模板

持续更新..

  • 会不定期的将在工作中接触大数据组件时做的去敏测试代码上传到对应的文件夹下供初学者参考,少走弯路 包括自己每天更新的大数据印象笔记 更新的进度和规划在issues 中
  • 由于精力有限 今年计划重心是在实时计算上 flink 和 sparkStreaming spark结构化流公司不用 有空再去搞
  • 开更..