- 当两张表关联的时候,如果一张表关联的不是分布列,那么就会发生表的广播或者重分布,将数据移到一个节点上进行关联,从而获得数据。这里详细的介绍什么时候广播,什么时候重分布。 分布式的关联有两种:(1) 单DN关联。关联键与分布列一致,只要在单个库关联后得到结果即可。(2)跨DN关联。关联键与分布列不一致,需要数据重分布,转换成单库关联查询,从而实现表的关联。 不管是采用广播还是重分布首先必须保证... 当两张表关联的时候,如果一张表关联的不是分布列,那么就会发生表的广播或者重分布,将数据移到一个节点上进行关联,从而获得数据。这里详细的介绍什么时候广播,什么时候重分布。 分布式的关联有两种:(1) 单DN关联。关联键与分布列一致,只要在单个库关联后得到结果即可。(2)跨DN关联。关联键与分布列不一致,需要数据重分布,转换成单库关联查询,从而实现表的关联。 不管是采用广播还是重分布首先必须保证...
- 1 Hang问题基础知识GaussDB 200为分布式数据库,通常由于单节点亚健康、系统资源紧张或查询本身的计划等问题,造成系统疑似发生Hang。Hang问题的产生原因由很多种,比如,死锁等待、日志同步等待、事务超时、通信故障、数据溢出发生死循环等等,更为常见的是由于执行慢、中间结果集倾斜而导致的疑似Hang。掌握Hang问题的基本定位方法对于大集群环境下快速找准疑似阻塞点,修复故障环境或优... 1 Hang问题基础知识GaussDB 200为分布式数据库,通常由于单节点亚健康、系统资源紧张或查询本身的计划等问题,造成系统疑似发生Hang。Hang问题的产生原因由很多种,比如,死锁等待、日志同步等待、事务超时、通信故障、数据溢出发生死循环等等,更为常见的是由于执行慢、中间结果集倾斜而导致的疑似Hang。掌握Hang问题的基本定位方法对于大集群环境下快速找准疑似阻塞点,修复故障环境或优...
- 资源管控的目的是基于业务场景和可用资源,进行合理的资源与并发度管控,以保障数据库可以在高负载场景下正常运行,不会因为资源争抢和耗尽出现系统卡死,提升系统整体吞吐量。 资源管控的目的是基于业务场景和可用资源,进行合理的资源与并发度管控,以保障数据库可以在高负载场景下正常运行,不会因为资源争抢和耗尽出现系统卡死,提升系统整体吞吐量。
- DIS如何实现转储数据至DWS的特定列DIS支持将源数据类型为JSON格式的数据转储至DWS。转储前,需要配置源数据Schema。源数据Schema,即用户的JSON数据样例,用于描述JSON数据格式。DIS可以根据此JSON数据样例生成Avro schema, 将通道内上传的JSON数据转换为Parquet或CarbonData格式。参考创建源数据Schema,创建源数据Schema。如下... DIS如何实现转储数据至DWS的特定列DIS支持将源数据类型为JSON格式的数据转储至DWS。转储前,需要配置源数据Schema。源数据Schema,即用户的JSON数据样例,用于描述JSON数据格式。DIS可以根据此JSON数据样例生成Avro schema, 将通道内上传的JSON数据转换为Parquet或CarbonData格式。参考创建源数据Schema,创建源数据Schema。如下...
- DWS与RDS和MRS的区别 DWS与RDS和MRS的区别
- SQL性能差,优化方法 SQL性能差,优化方法
- 通过CDM将DWS的数据归档到OBS上 通过CDM将DWS的数据归档到OBS上
- DWS数据库的SQL调优的基础,了解执行计划,并根据执行计划做相应的调优 DWS数据库的SQL调优的基础,了解执行计划,并根据执行计划做相应的调优
- DWS的用户的权限管理操作 DWS的用户的权限管理操作
- DWS数据库中的数据需要日常的运维操作:(1)analyze:搜集表的最新的统计信息,对性能影响很大;(2)vacuum:对系统的碎片进行整理,回收,提高系统扫描速度; DWS数据库中的数据需要日常的运维操作:(1)analyze:搜集表的最新的统计信息,对性能影响很大;(2)vacuum:对系统的碎片进行整理,回收,提高系统扫描速度;
- DWS表的导入导出方式有三种:(1)insert方式;(2)copy方式;(3)OBS和GDS方式 DWS表的导入导出方式有三种:(1)insert方式;(2)copy方式;(3)OBS和GDS方式
- DWS表设计注意的一些原则:(1)行列存的选择;(2)压缩比的选择;(3)分布列的选择;(4)分区的设计;(5)索引的取舍;(6)局部聚簇 DWS表设计注意的一些原则:(1)行列存的选择;(2)压缩比的选择;(3)分布列的选择;(4)分区的设计;(5)索引的取舍;(6)局部聚簇
- 概要:1)零售业务维度设计4步法2)维度表设计细节3)事实表设计细节一、维度模型4步设计法1)业务过程选择 *通常由某个操作型业务系统支撑 *业务过程建立或获取关键性度量2)粒度声明 *事实表中的每个行的内容应当如何描述 *最终事实表的粒度与主键应该是等价的3)确认维度 *who,what,where,when,why and how *维度的... 概要:1)零售业务维度设计4步法2)维度表设计细节3)事实表设计细节一、维度模型4步设计法1)业务过程选择 *通常由某个操作型业务系统支撑 *业务过程建立或获取关键性度量2)粒度声明 *事实表中的每个行的内容应当如何描述 *最终事实表的粒度与主键应该是等价的3)确认维度 *who,what,where,when,why and how *维度的...
- 本次解读内容概要:1)缓慢变化维2)高级事实表技术3)高级维度表技术一、缓慢变化维(Slowly Changing Dimension SCD)0)Type0:原值保留1)Type1:覆盖2)Type2:增加新行 能够保留历史变化情况,会增加数据量(查询也会增加一些复杂度) 拉链表(几种错误场景:断链、交叉链、重复链)3)Type3:增加新列(属性) 用新增的列来保存... 本次解读内容概要:1)缓慢变化维2)高级事实表技术3)高级维度表技术一、缓慢变化维(Slowly Changing Dimension SCD)0)Type0:原值保留1)Type1:覆盖2)Type2:增加新行 能够保留历史变化情况,会增加数据量(查询也会增加一些复杂度) 拉链表(几种错误场景:断链、交叉链、重复链)3)Type3:增加新列(属性) 用新增的列来保存...
- 本次讲解的内容概要:1)维度建模过程2)EDW总线矩阵3)事实表基础技术4)维度表基础技术一、维度建模过程(过程迭代,逐步求精)1)需求分析:业务需求理解(BD)和信息系统探索2)建模研讨:行业领域专家、数据管理人员、模型设计人员(多方参与研讨)3)维度设计:业务过程选择->粒度声明->确认维度->确认事实二、数据仓库总线矩阵1)多个事实表共享维度2)每一行代表一个业务过程,每一列代表一个一... 本次讲解的内容概要:1)维度建模过程2)EDW总线矩阵3)事实表基础技术4)维度表基础技术一、维度建模过程(过程迭代,逐步求精)1)需求分析:业务需求理解(BD)和信息系统探索2)建模研讨:行业领域专家、数据管理人员、模型设计人员(多方参与研讨)3)维度设计:业务过程选择->粒度声明->确认维度->确认事实二、数据仓库总线矩阵1)多个事实表共享维度2)每一行代表一个业务过程,每一列代表一个一...
上滑加载中
推荐直播
-
华为云码道-玩转OpenClaw,在线养虾2026/03/11 周三 19:00-21:00
刘昱,华为云高级工程师/谈心,华为云技术专家/李海仑,上海圭卓智能科技有限公司CEO
OpenClaw 火爆开发者圈,华为云码道最新推出 Skill ——开发者只需输入一句口令,即可部署一个功能完整的「小龙虾」智能体。直播带你玩转华为云码道,玩转OpenClaw
回顾中 -
华为云码道-AI时代应用开发利器2026/03/18 周三 19:00-20:00
童得力,华为云开发者生态运营总监/姚圣伟,华为云HCDE开发者专家
本次直播由华为专家带你实战应用开发,看华为云码道(CodeArts)代码智能体如何在AI时代让你的创意应用快速落地。更有华为云HCDE开发者专家带你用码道玩转JiuwenClaw,让小艺成为你的AI助理。
回顾中 -
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中
热门标签