本文高度引用了BigData-Notes的文章,并综合其他资料整理修改。
- 分布式文件存储系统 — HDFS
- 分布式计算框架 — MapReduce
- 集群资源管理器 — YARN
- Hadoop 单机伪集群环境搭建
- Hadoop 集群环境搭建
- HDFS 常用 Shell 命令
- HDFS Java API 的使用
- 基于 Zookeeper 搭建 Hadoop 高可用集群
- Hadoop级简入门
- MapReduce编程模型和计算框架架构原理
- Hive 简介及核心概念
- Linux 环境下 Hive 的安装部署
- Hive CLI 和 Beeline 命令行的基本使用
- Hive 常用 DDL 操作
- Hive 分区表和分桶表
- Hive 视图和索引
- Hive 常用 DML 操作
- Hive 数据查询详解
- Hive实现WordCount详解
- Hive SQL的编译过程
- Spark 简介
- Spark 开发环境搭建
- 弹性式数据集 RDD
- RDD 常用算子详解
- Spark 运行模式与作业提交
- Spark 累加器与广播变量
- 基于 Zookeeper 搭建 Spark 高可用集群
- Hbase 简介
- HBase 系统架构及数据结构
- HBase 基本环境搭建
- HBase 集群环境搭建
- HBase 常用 Shell 命令
- HBase Java API
- Hbase 过滤器详解
- HBase 协处理器详解
- HBase 容灾与备份
- HBase的 SQL 中间层 —— Phoenix
- Spring/Spring Boot 整合 Mybatis + Phoenix
- Storm 和流处理简介
- Storm 核心概念详解
- Storm 单机环境搭建
- Storm 集群环境搭建
- Storm 编程模型详解
- Storm 项目三种打包方式对比分析
- Storm 集成 Redis 详解
- Storm 集成 HDFS/HBase
- Storm 集成 Kafka