Null
https://zhuanlan.zhihu.com/p/426005241
数据治理
###HIVE SQL语法
https://zhuanlan.zhihu.com/p/575040340
基础介绍 Hologres利用混合行/列存储来优化HSAP(Hybrid serving and analytical processing)中使用的点查询,列扫描和数据摄取等操作。 执行上下文作为系统线程和用户任务之间的资源抽象。 执行上下文可以以很少的上下文切换开销进行写作调度。 查询被并行化并映射到执行上下文以进行并发执行。
##建模理论 ###范式建模 范式是关系型数据库的基本概念。是指符合某些条件、符合某些规则的关系集合。范式是分级的,每向上一级,条件和规则更加严格,每一级是下一级的子集。 范式最主要的目的是消除冗余,每一份信息必须存放一次,也只能存储一次。数据的冗余不仅仅会造成存储资源的浪费,而且可能会引发数据的更新异常。 关系型数据库范式 1FN 数据库表中的字段都是单一属性的,不可再分;就是不允许表中还有表 2FN 在第一范式的基础上,还要满足数据表里的每一条数据记录,都是可唯一标识的。而且所有非主键字段,都必须完全依赖主键,不能只依赖主键的一部分。 3FN 在第二范式的基础上,确保数据表中的每一个非主键字段都和主键字段直接相关, 也就是说,要求数据表中的所有非主键字段不能依赖于其他非主键字段。 (即,不能存在非主属性A依赖于非主属性B,非主属性B依赖于主键c的情况, 即存在”A一B一c”的决定关系)通俗地讲,该规则的意思是所有非主键属性之间不能有依赖关系,必须相互独立。
物化视图选择
Spark RPC