EI企业智能_标签_开发者

GaussDB(DWS)《ROACH小课堂Ⅰ测试方法篇之测试基础理论》

高手也要练基本功;测试基础理论

一剑战八荒

发表于2021-07-27 16:58:01

4726 0 2

4.7k 0 2

高手也要练基本功;测试基础理论

EI企业智能云数据仓库 GaussDB(DWS)

FusionInsight SqoopShell使用案例

1 SqoopShell使用简介sqoop-shell是一个Loader的shell工具，其所有功能都是通过执行脚本“sqoop2-shell”来实现的。sqoop-shell工具提供了如下功能：支持创建和更新连接器支持创建和更新作业支持删除连接器和作业支持以同步或异步的方式启动作业支持停止作业支持查询作业状态支持查询作业历史执行记录支持复制连接器和作业支持创建和更新转换步骤支持指...

Jia装大佬

发表于2021-07-23 11:36:22

10324 0 0

10.3k 0 0

1 SqoopShell使用简介sqoop-shell是一个Loader的shell工具，其所有功能都是通过执行脚本“sqoop2-shell”来实现的。sqoop-shell工具提供了如下功能：支持创建和更新连接器支持创建和更新作业支持删除连接器和作业支持以同步或异步的方式启动作业支持停止作业支持查询作业状态支持查询作业历史执行记录支持复制连接器和作业支持创建和更新转换步骤支持指...

EI企业智能 FusionInsight

GaussDB(DWS) 客户端gsql功能增强之逻辑控制

为了简化数据库SQL脚本的开发模式和执行环境，数据库一般会把数据库交互的功能封装在客户端工具中，用以增加SQL脚本的灵活性，提高脚本的开发效率。 GaussDB(DWS)数据库数据库客户端工具gsql的增强特性包含动态变量、逻辑控制、大小比较、循环体等。通过这些增强特性可以实现流程式的SQL开发，提升数据仓库的SQL作业开发效率。

hhx1003

发表于2021-07-23 11:15:54

11748 0 0

11.7k 0 0

为了简化数据库SQL脚本的开发模式和执行环境，数据库一般会把数据库交互的功能封装在客户端工具中，用以增加SQL脚本的灵活性，提高脚本的开发效率。 GaussDB(DWS)数据库数据库客户端工具gsql的增强特性包含动态变量、逻辑控制、大小比较、循环体等。通过这些增强特性可以实现流程式的SQL开发，提升数据仓库的SQL作业开发效率。

EI企业智能云数据仓库 GaussDB(DWS) Gauss AP

【TD迁移GaussDB(DWS)】【函数迁移之二】TD常用日期函数适配

日期函数是数据库非常重要的函数类型，我们从TD迁移到GaussDB(DWS)时，有很多TD特有的日期函数，GaussDB(DWS)没有的，这些日期函数需要在GaussDB(DWS)建一些自定义函数做迁移适配。本文描述了一次迁移过程中遇到的日期函数，并描述了如何通过自定义函数来适配脚本迁移。

SeqList

发表于2021-07-22 18:16:06

12179 0 0

12.1k 0 0

日期函数是数据库非常重要的函数类型，我们从TD迁移到GaussDB(DWS)时，有很多TD特有的日期函数，GaussDB(DWS)没有的，这些日期函数需要在GaussDB(DWS)建一些自定义函数做迁移适配。本文描述了一次迁移过程中遇到的日期函数，并描述了如何通过自定义函数来适配脚本迁移。

EI企业智能云数据仓库 GaussDB(DWS) Gauss AP

GaussDB(DWS) 列存delta表的简单介绍

在对列存表进行小批量数据插入时，会产生小CU，影响列存储的性能，对此，需要用一个依附于列存表的delta表来进行存储，并且定期将delta表的数据合入列存表中，这样既能发挥列存储的优势，又能兼顾各种使用场景。

上弦月

发表于2021-07-20 15:27:34

15693 0 2

15.6k 0 2

在对列存表进行小批量数据插入时，会产生小CU，影响列存储的性能，对此，需要用一个依附于列存表的delta表来进行存储，并且定期将delta表的数据合入列存表中，这样既能发挥列存储的优势，又能兼顾各种使用场景。

EI企业智能云数据仓库 GaussDB(DWS) Gauss AP

GaussDB(DWS) inlist2join优化介绍

摘要：对于inlist2join优化的原理和结果展示。

积少成多

发表于2021-07-16 20:59:31

7515 0 0

7.5k 0 0

摘要：对于inlist2join优化的原理和结果展示。

EI企业智能云数据仓库 GaussDB(DWS) Gauss AP

GaussDB(DWS) ESL版本集群监控指标简介

GaussDB(DWS) ESL版本使用FusionInsight Manager管理平台提供集群状态监控，告警管理，监控采集等功能。集群安装完成后，登录管理平台即可查看集群的状态监控指标，针对这些监控指标做简单介绍。

power_gouge

发表于2021-07-16 11:48:25

11187 0 0

11.1k 0 0

GaussDB(DWS) ESL版本使用FusionInsight Manager管理平台提供集群状态监控，告警管理，监控采集等功能。集群安装完成后，登录管理平台即可查看集群的状态监控指标，针对这些监控指标做简单介绍。

EI企业智能云数据仓库 GaussDB(DWS) 数据库 Gauss AP

GaussDB(DWS) 极致性价比--冷热数据管理

随着数据的持续增长，数据存储的高性价比是云上数据仓库的核心竞争力之一，GaussDB(DWS)目前支持特性冷热数据管理。

别相信任何人~

发表于2021-07-14 11:45:20

12817 0 2

12.8k 0 2

随着数据的持续增长，数据存储的高性价比是云上数据仓库的核心竞争力之一，GaussDB(DWS)目前支持特性冷热数据管理。

EI企业智能云数据仓库 GaussDB(DWS) Gauss AP

mockito——让你轻松地进行单元测试的强大工具

相信每一个程序猿在写Unit Test的时候都会碰到一些令人头疼的问题：如何测试一个rest接口；如何测试一个包含客户端调用服务端的复杂方法；如何测试一个包含从数据库读取数据的复杂方法。。。这些问题mockito都可以帮我们轻松地解决。Mockito是啥？Mockito 是一个强大的用于 Java 开发的模拟测试框架, 通过 Mockito 我们可以创建和配置 Mock 对象, 进而简化有外...

数据湖爱好者

发表于2021-07-13 16:18:43

20782 0 0

20.7k 0 0

相信每一个程序猿在写Unit Test的时候都会碰到一些令人头疼的问题：如何测试一个rest接口；如何测试一个包含客户端调用服务端的复杂方法；如何测试一个包含从数据库读取数据的复杂方法。。。这些问题mockito都可以帮我们轻松地解决。Mockito是啥？Mockito 是一个强大的用于 Java 开发的模拟测试框架, 通过 Mockito 我们可以创建和配置 Mock 对象, 进而简化有外...

EI企业智能 Scala 数据湖探索 DLI 智能数据

mockito——让你轻松地进行单元测试的强大工具

相信每一个程序猿在写Unit Test的时候都会碰到一些令人头疼的问题：如何测试一个rest接口；如何测试一个包含客户端调用服务端的复杂方法；如何测试一个包含从数据库读取数据的复杂方法。。。这些问题mockito都可以帮我们轻松地解决。

我爱次火锅锅

发表于2021-07-13 11:54:00

16709 0 0

16.7k 0 0

相信每一个程序猿在写Unit Test的时候都会碰到一些令人头疼的问题：如何测试一个rest接口；如何测试一个包含客户端调用服务端的复杂方法；如何测试一个包含从数据库读取数据的复杂方法。。。这些问题mockito都可以帮我们轻松地解决。

EI企业智能大数据数据湖探索 DLI 智能数据

hive server客户端连接泄漏导致hs重启

1 问题描述从某个时间点开始，Manager页面hiveserver状态在良好和恢复中频繁变化，后台检查hiveserver频繁重启。2 问题分析1. 从hive.log日志可见健康检查多次失败，NodeAgent因健康检查多次失败认为服务已经异常，重启HiveServer进程，Manager页面状态显示正在恢复。2. 健康检查为NodeAgent调用HiveServer的j...

Nature_L

发表于2021-07-13 11:05:54

11221 0 0

11.2k 0 0

1 问题描述从某个时间点开始，Manager页面hiveserver状态在良好和恢复中频繁变化，后台检查hiveserver频繁重启。2 问题分析1. 从hive.log日志可见健康检查多次失败，NodeAgent因健康检查多次失败认为服务已经异常，重启HiveServer进程，Manager页面状态显示正在恢复。2. 健康检查为NodeAgent调用HiveServer的j...

EI企业智能 FusionInsight Hive

GaussDB（DWS）stream线程池设计（一）

Stream算子作为SQL join操作时频繁发生的执行算子，负责CN节点GATHER数据，DN节点REDISTRIBUTE和BROACAST数据。大集群高并发场景下，Stream算子过多可能会导致通信的性能瓶颈，引起性能劣化（2000个stream同时启动，进程初始化耗时从ms级劣化到s级），因此需要尽可能减少Stream算子。但是在某些现场环境下，存在数据倾斜、join查询不包含必要分布...

c.j

发表于2021-07-09 14:27:04

8534 0 0

8.5k 0 0

Stream算子作为SQL join操作时频繁发生的执行算子，负责CN节点GATHER数据，DN节点REDISTRIBUTE和BROACAST数据。大集群高并发场景下，Stream算子过多可能会导致通信的性能瓶颈，引起性能劣化（2000个stream同时启动，进程初始化耗时从ms级劣化到s级），因此需要尽可能减少Stream算子。但是在某些现场环境下，存在数据倾斜、join查询不包含必要分布...

EI企业智能云数据仓库 GaussDB(DWS) 数据通信 Gauss AP

【MRS】【FusionInsight】Hive并发MSCK Repair实践

【摘要】对Hive所有的表逐个进行MSCK Repair，修复效率将会很慢，例如修复1000+个表，30+万个分区，修复时长需要5~6个小时左右，耗时非常长，大大占用了变更时间窗。因此，优化改进MSCK Repair，有效提升修复效率，将变得尤为急迫和重要。优化后，10并发执行MSCK Repair修复1000+个表，30+万个分区，修复操作只需0.5小时左右，效率提升10~12倍。

小源源

发表于2021-07-06 20:42:21

11149 1 1

11.1k 1 1

【摘要】对Hive所有的表逐个进行MSCK Repair，修复效率将会很慢，例如修复1000+个表，30+万个分区，修复时长需要5~6个小时左右，耗时非常长，大大占用了变更时间窗。因此，优化改进MSCK Repair，有效提升修复效率，将变得尤为急迫和重要。优化后，10并发执行MSCK Repair修复1000+个表，30+万个分区，修复操作只需0.5小时左右，效率提升10~12倍。

EI企业智能 FusionInsight Hive MapReduce

燃！世界人工智能大会2021即将重磅开幕

华为云最强参会攻略，不容错过！

华为云头条

发表于2021-07-06 20:14:24

6544 0 0

6.5k 0 0

华为云最强参会攻略，不容错过！

人工智能 EI企业智能 AI平台

Hiveserver FullGC一直处于恢复中问题分析

问题描述：有hiveserver反复处于恢复中，分析该hiveserver日志发现频繁的FullGC，hiveserver的GC配置为64GB。问题分析：1. 观察hiveserver监控，发现在较短时间内hiveserver内存使用率快速升高。根据内存骤升初步推测为业务导致。2. 取得hiveserver故障节点对应的内存dump日志及 hiveserver运行日志进...

Nature_L

发表于2021-07-05 16:30:32

10071 0 0

10.0k 0 0

问题描述：有hiveserver反复处于恢复中，分析该hiveserver日志发现频繁的FullGC，hiveserver的GC配置为64GB。问题分析：1. 观察hiveserver监控，发现在较短时间内hiveserver内存使用率快速升高。根据内存骤升初步推测为业务导致。2. 取得hiveserver故障节点对应的内存dump日志及 hiveserver运行日志进...

EI企业智能 FusionInsight