1. Spark Join

    Inner

    2021/03/21 spark

  2. SPARK AE

    Spark AE

    2021/03/17 spark

  3. Spark 优化

    Spark SQL 聚合实现原理

    2021/03/14 spark

  4. Spark Shuffle

    1.sortShufflewriter 适用于什么场景,什么时候只对partition id排序,什么时候同时对partiition id 与key排序

    2021/03/12 spark

  5. spark Memory Model

    Spark Memory usages

    2021/03/12 spark

  6. Spark SQL CodeGeneration

    Volcano Model

    2021/03/08 spark

  7. Spark Core

    RDD

    2021/03/07 spark

  8. Spark Bucket

    引入Bucket 就是为了优化SortMergeJoin的shuffle 和 sort, Bucket 的思想是 pre-(shuffle+sort)

    2021/03/07 spark

  9. Cube Kylin

    场景

    2021/03/07 cube

  10. Calcite Parser

    编译知识

    2021/03/07 calcite