/Spark-2.3.1

Spark-2.3.1源码解读

Primary LanguageScalaApache License 2.0Apache-2.0

浪尖带着你阅读spark源码

Spark Core源码阅读

  1. Spark Context 阅读要点

  2. Spark的缓存,变量,shuffle数据等清理及机制

  3. Spark-submit关于参数及部署模式的部分解析

  4. GroupByKey VS ReduceByKey

  5. OrderedRDDFunctions那些事

  6. 高效使用mappartitions

  7. standalone模式下executor调度策略

Spark Sql源码阅读

  1. Spark Sql源码阅读

  2. hive on spark调优

  3. Spark SQL 多维聚合分析应用案例

Spark Streaming源码阅读

  1. 动态发现新增分区

  2. Dstream join 操作和 RDD join 操作的区别

  3. PIDController源码赏析及 back pressure 实现思路

  4. Streaming Context重点摘要

  5. checkpoint 必知必会

更多大数据文章请关注浪尖微信公众号:Spark学习技巧

image

浪尖和阿里大神一起创建了知识星球-spark技术学院,欢迎大家扫码加入:

image