Inner
Spark AE
Spark SQL 聚合实现原理
1.sortShufflewriter 适用于什么场景,什么时候只对partition id排序,什么时候同时对partiition id 与key排序
Spark Memory usages
Volcano Model
RDD
引入Bucket 就是为了优化SortMergeJoin的shuffle 和 sort, Bucket 的思想是 pre-(shuffle+sort)
场景
编译知识
Streaming System 相关的论文读物
Port of LevelDB to Java
Kubernetes中文指南/云原生应用架构实践手册 - https://jimmysong.io/kubernetes-handbook
Mirror of Apache Zeppelin