1. 2024/01/15

  2. 高阶SQL

    Null

    2024/01/10 sql

  3. OneData理论

    https://zhuanlan.zhihu.com/p/426005241

    2023/04/18 onedata

  4. 数据治理

    数据治理

    2023/04/06 数据治理

  5. SQL语法

    ###HIVE SQL语法

    2023/03/23 sql

  6. Table store

    https://zhuanlan.zhihu.com/p/575040340

    2023/03/11 store

  7. hologres基础介绍

    基础介绍 Hologres利用混合行/列存储来优化HSAP(Hybrid serving and analytical processing)中使用的点查询,列扫描和数据摄取等操作。 执行上下文作为系统线程和用户任务之间的资源抽象。 执行上下文可以以很少的上下文切换开销进行写作调度。 查询被并行化并映射到执行上下文以进行并发执行。

    2023/03/10 hologres

  8. 数仓建模理论

    ##建模理论 ###范式建模 范式是关系型数据库的基本概念。是指符合某些条件、符合某些规则的关系集合。范式是分级的,每向上一级,条件和规则更加严格,每一级是下一级的子集。 范式最主要的目的是消除冗余,每一份信息必须存放一次,也只能存储一次。数据的冗余不仅仅会造成存储资源的浪费,而且可能会引发数据的更新异常。 关系型数据库范式 1FN 数据库表中的字段都是单一属性的,不可再分;就是不允许表中还有表 2FN 在第一范式的基础上,还要满足数据表里的每一条数据记录,都是可唯一标识的。而且所有非主键字段,都必须完全依赖主键,不能只依赖主键的一部分。 3FN 在第二范式的基础上,确保数据表中的每一个非主键字段都和主键字段直接相关, 也就是说,要求数据表中的所有非主键字段不能依赖于其他非主键字段。 (即,不能存在非主属性A依赖于非主属性B,非主属性B依赖于主键c的情况, 即存在”A一B一c”的决定关系)通俗地讲,该规则的意思是所有非主键属性之间不能有依赖关系,必须相互独立。

    2023/03/08 数仓 建模

  9. 物化视图

    物化视图选择

    2021/03/21 spark

  10. Spark RPC

    Spark RPC

    2021/03/21 spark