God-Of-BigData: A repository from eehuangyanwen

已经更新100+篇~
关注公众号~

大数据成神之路目录

大数据开发基础篇

🎿Java基础	📝NIO	📖并发	🎸JVM	💵分布式	💾Zookeeper	👊RPC	🎨Netty	💻Linux
Java基础	NIO	并发容器	JVM	分布式	zookeeper	RPC	Netty	Linux

大数据框架学习篇


Hadoop	Hive	Spark	Flink	HBase	Kafka	Zookeeper	Flume	Sqoop	Azkaban

大数据开发实战进阶篇


Flink实战进阶	Spark实战进阶	Kafka实战进阶

大数据开发面试篇

TODO

第一部分: 大数据开发基础篇

一、Java基础

二、NIO基础

三、Java并发容器

四、JVM深度解析和面试点

先来10篇基础热身

再来5篇详细解说

五、分布式理论基础和原理

六、大数据框架开发基础-Zookeeper

七、大数据框架开发基础-RPC

八、大数据框架基石之网路通信-Netty

第二部分:大数据框架学习篇

本部分引用了Bigdata-Notes的文章，作者是heibaiying，大佬写的文章非常好，欢迎大家关注他的博客。我个人会持续补充更有深度和实战性的文章~

一、Hadoop

二、Hive

三、Spark

Spark Core :

Spark SQL :

Spark Streaming ：

四、Flink

Flink当前最火的实时计算引擎-入门篇

Flink当前最火的实时计算引擎-放弃篇

五、HBase

六、Kafka

Kafka基本原理：

分布式消息队列Kafka原理及与流式计算的集成：

七、Zookeeper

八、Flume

九、Sqoop

十、Azkaban

十一、TODO

[OLAP引擎-HiveSQL的高级调优和原理分析]

[离线列式大数据存储-Hbase的原理和亿级数据下的生产应用]

[Nosql之王-Redis高级特性和实现原理]

[Spark的原理和生产应用(一)]

[Spark的原理和生产应用(二)]

[Spark的原理和生产应用(三)]

[大数据算法(一)]

[大数据算法(二)]

第三部分:大数据开发实战进阶篇

Flink实战进阶文章合集

Spark实战进阶文章合集

Kafka实战进阶文章合集

本系列的大纲会根据实际情况进行调整，欢迎大家关注~

SSS、声明

文档中参考引用了大量网络上的博客和文章，大部分给出了出处，有些没写，如果造成了侵权行为，请您联系我，立即删除~

QQQ、扫我关注公众号

关注公众号：每天定时推送Hadoop/Spark/Flink等最新的大数据干货技术文章,学习资料下载等

KKK、如果对你有用，欢迎请我喝杯咖啡

备注Github，感谢您～

HHH、扫我加群

备注来自GitHub加群，小助手会拉你进大数据讨论组，一起学习交流，期待你的到来~

为什么有这个文档

以前这里只是几个txt文档
是我面试腾讯阿里美团等公司大数据开发工程师的过程中总结出来的大数据开发的必知必会的知识点~

但是，我发现，我有必要
总结一个大数据开发的进阶路线
我知道很多java后端开发同学厌倦CRUD了，但是又不知道大数据这个路线是啥样的~
这个是我的成长路线~
现在看起来
当初没有走错~
当然,数据开发有很多方向比如数据仓库，数据分析
我这里单纯面对数据应用层或者中间件方向，也是大数据方向个人成长比较好的一个方向(我自己认为的，你不同意就算了，哈哈)~
这个是我的成长路线
欢迎各种PR，格式修改也行，总之一切能让这个文档好起来的，都是欢迎的~

言而总之

大数据成神之路 该系列文章将为希望从事大数据开发或者由后端转型为大数据开发的工程师们指出需要学习的知识点和路径，本系列文章同时致敬我曾经在网络上看到无数个Java和大数据系列文章，深受启发同时也收货很多。

本系列文章引用了很多或者二次总结了各位前辈的文章，每篇文章后面都给出了引用，本着不重复造轮子的原则，本人会对其中的一些错误进行订正，感谢各位前辈的付出~

本系列文章希望为那些还在数据开发方向迷茫的人领路，文章会持续更新

欢迎关注公众号‘大数据技术与架构’或者搜索import_bigdata关注~

eehuangyanwen/God-Of-BigData