智能数据_标签_开发者

基于多用户共享的Spark集群弹性扩缩容

DLI数据湖探索服务通过动态资源分配的开启、以及多用户共享default集群弹性扩缩容使用，在充分使用计算资源的基础上，节省了用户的成本。同时，对于用户按需专属队列，DLI已经支持用户指定扩缩容计划的定时扩缩容。用户根据自己的业务繁忙周期，制定自己所需的队列扩缩容计划，定时预置满足业务所需的计算资源，同时节省了成本。

霞光

发表于2020-12-28 23:32:32

12688 0 1

12.6k 0 1

DLI数据湖探索服务通过动态资源分配的开启、以及多用户共享default集群弹性扩缩容使用，在充分使用计算资源的基础上，节省了用户的成本。同时，对于用户按需专属队列，DLI已经支持用户指定扩缩容计划的定时扩缩容。用户根据自己的业务繁忙周期，制定自己所需的队列扩缩容计划，定时预置满足业务所需的计算资源，同时节省了成本。

spark 数据湖探索 DLI EI企业智能智能数据

Orca: A Modular Query Optimizer Architecture for Big Data

一个通用，可拓展，多核，高性能大数据优化器GPDB采用了shared-nothing的多处理架构，每个处理器拥有自己的内存，操作系统和磁盘等。主节点（master）管理其他的数据库实例（segment），数据在节点的分布可以是hashed，replicated，singleton等。ORCA基于Cascades优化流程（top-down)，并且可以作为其他存储系统的独立优化器模块；提供了一种...

hzjturbo

发表于2020-12-27 21:35:59

12355 0 0

12.3k 0 0

一个通用，可拓展，多核，高性能大数据优化器GPDB采用了shared-nothing的多处理架构，每个处理器拥有自己的内存，操作系统和磁盘等。主节点（master）管理其他的数据库实例（segment），数据在节点的分布可以是hashed，replicated，singleton等。ORCA基于Cascades优化流程（top-down)，并且可以作为其他存储系统的独立优化器模块；提供了一种...

数据湖探索 DLI 智能数据 EI企业智能

Flink SQL中的WindowOperator

在流处理的实际应用中，数据是连续不断的，因此我们不可能等待所有的数据都到了才开始处理。虽然我们可以对每来一条数据就处理一次，但是有一些场景我们需要使用一段时间内的数据进行计算，比如统计在一分钟内用户对某商品的浏览量，而这就是window窗口的使用场景。Flink sql中对于窗口的使用主要是通过TUMBLE、HOP和SESSION，而这些操作都是基于WindowOperato...

潇湘暮雨

发表于2020-12-27 20:24:16

9820 0 0

9.8k 0 0

在流处理的实际应用中，数据是连续不断的，因此我们不可能等待所有的数据都到了才开始处理。虽然我们可以对每来一条数据就处理一次，但是有一些场景我们需要使用一段时间内的数据进行计算，比如统计在一分钟内用户对某商品的浏览量，而这就是window窗口的使用场景。Flink sql中对于窗口的使用主要是通过TUMBLE、HOP和SESSION，而这些操作都是基于WindowOperato...

智能数据 EI企业智能数据湖探索 DLI

基于模型驱动的智能自动化流水线建设

规范设计以关系建模、维度建模理论支撑，实现规范化、可视化、标准化数据模型开发，定位于数据治理流程设计落地阶段，输出成果用于指导开发人员实践落地数据治理方法论。同时与周边服务数据治理、数据资产等联接，协助用户在模型创建发布后，自动化创建相关联同步作业流水线。当模型创建保存成功后，点击发布。发布成功后会自动进行物理表、数据资产、质量作业等的自动化创建或更新。用户可以在配置中心选择需要自动化流水线...

玄米茶

发表于2020-12-23 18:23:17

11055 0 0

11.0k 0 0

规范设计以关系建模、维度建模理论支撑，实现规范化、可视化、标准化数据模型开发，定位于数据治理流程设计落地阶段，输出成果用于指导开发人员实践落地数据治理方法论。同时与周边服务数据治理、数据资产等联接，协助用户在模型创建发布后，自动化创建相关联同步作业流水线。当模型创建保存成功后，点击发布。发布成功后会自动进行物理表、数据资产、质量作业等的自动化创建或更新。用户可以在配置中心选择需要自动化流水线...

EI企业智能数据治理中心 DataArts Studio 智能数据

从零开始画自己的DAG作业依赖图(一)--前期准备

背景：由于业务场景需要展示作业之间的依赖关系，由于一些开源的插件和当前的业务逻辑有一些冲突，个人打算尝试从零开始，一点点实现自己的DAG图。同时用博客记录自己实现过程和总结，不正确的地方，欢迎指正提升。场景分析： 1. 数据开发中常常有作业之间的依赖，在执行作业的时候，可能会出现有些作业失败，或者重试，这时候，运维或者开发的人，需要有一个很直观的图去展示作业之...

flowdeep

发表于2020-12-18 18:23:14

15131 2 1

15.1k 2 1

背景：由于业务场景需要展示作业之间的依赖关系，由于一些开源的插件和当前的业务逻辑有一些冲突，个人打算尝试从零开始，一点点实现自己的DAG图。同时用博客记录自己实现过程和总结，不正确的地方，欢迎指正提升。场景分析： 1. 数据开发中常常有作业之间的依赖，在执行作业的时候，可能会出现有些作业失败，或者重试，这时候，运维或者开发的人，需要有一个很直观的图去展示作业之...

智能数据 EI企业智能数据治理中心 DataArts Studio

Java云服务开发知识学习之 java垃圾收集

§ java内存区域Q; Java虚拟机规范将JVM虚拟机所管理的内存分为几部分？如果是多选题，估计会给一些不在里面的，例如直接内存。A：程序计数器、java虚拟机栈、本地方法栈、方法区、堆。java对象在内存上的分配：§ GC策略Q：java使用根搜索算法来确定对象是否存货，哪些对象可以作为GC Roots？A：虚拟机栈（栈帧中的本地变量表）中的引用的对象方法区中的类静态属性引用的对象方法...

breakDawn

发表于2020-12-15 17:41:27

11067 0 1

11.0k 0 1

§ java内存区域Q; Java虚拟机规范将JVM虚拟机所管理的内存分为几部分？如果是多选题，估计会给一些不在里面的，例如直接内存。A：程序计数器、java虚拟机栈、本地方法栈、方法区、堆。java对象在内存上的分配：§ GC策略Q：java使用根搜索算法来确定对象是否存货，哪些对象可以作为GC Roots？A：虚拟机栈（栈帧中的本地变量表）中的引用的对象方法区中的类静态属性引用的对象方法...

EI企业智能可信智能计算服务 TICS 数据治理中心 DataArts Studio 智能数据

Java原始数据类型强化学习之常量池

java常量池

breakDawn

发表于2020-12-15 17:15:51

8269 0 0

8.2k 0 0

java常量池

EI企业智能可信智能计算服务 TICS 数据治理中心 DataArts Studio 智能数据

从Java源码上复习反射的一些问题

Q：用反射获取到的method对象，是返回一个method引用，还是返回1个拷贝的method对象？A：反射拿method对象时，会做一次拷贝，而不是直接返回引用，因此最好对频繁使用的同一个method做缓存，而不是每次都去查找。Q:getMethods()后自己做遍历获取方法和getMethod(methodName) 直接获取方法，为什么性能会有差异？A：getMethods() ...

breakDawn

发表于2020-12-15 17:10:33

8055 0 0

8.0k 0 0

Q：用反射获取到的method对象，是返回一个method引用，还是返回1个拷贝的method对象？A：反射拿method对象时，会做一次拷贝，而不是直接返回引用，因此最好对频繁使用的同一个method做缓存，而不是每次都去查找。Q:getMethods()后自己做遍历获取方法和getMethod(methodName) 直接获取方法，为什么性能会有差异？A：getMethods() ...

可信智能计算服务 TICS 数据治理中心 DataArts Studio EI企业智能智能数据

如何在Spark上运行apache beam

如何用spark提交apachebeam

breakDawn

发表于2020-12-15 17:00:50

7379 0 0

7.3k 0 0

如何用spark提交apachebeam

智能数据数据治理中心 DataArts Studio EI企业智能可信智能计算服务 TICS

Jupyter调用Spark Sql指导

小四三

发表于2020-12-10 15:18:09

12969 0 0

12.9k 0 0

Jupyter调用Spark Sql指导

EI企业智能 MapReduce服务 MRS 智能数据

Hue连接开启ldap认证的impala

本文用于指导在MRS 2.x版本非kerberos集群中使用Hue连接开启ldap认证的impala

小四三

发表于2020-12-10 11:14:59

12256 0 0

12.2k 0 0

本文用于指导在MRS 2.x版本非kerberos集群中使用Hue连接开启ldap认证的impala

EI企业智能智能数据 MapReduce服务 MRS

MRS普通集群Impala开启ldap认证

小四三

发表于2020-12-07 20:05:06

11175 0 0

11.1k 0 0

MRS普通集群Impala开启ldap认证

智能数据 EI企业智能 MapReduce服务 MRS

CarbonData物化视图简介

CarbonData中的物化视图的简单介绍及使用方法

笨熊爱喝cola

发表于2020-12-02 23:34:40

11072 0 1

11.0k 0 1

CarbonData中的物化视图的简单介绍及使用方法

智能数据表格存储服务 CloudTable EI企业智能

Spark内核解析之Spark-submit

本文主要是通过Spark代码走读来了解spark-submit的流程

笨熊爱喝cola

发表于2020-12-02 23:12:23

12204 0 0

12.2k 0 0

本文主要是通过Spark代码走读来了解spark-submit的流程

表格存储服务 CloudTable EI企业智能 spark 智能数据

数据湖探索DLI 12月服务功能更新

服务功能更新1.【新功能】支持交互式分析能力基于openLooKeng引擎，推出交互式查询能力，兼容业界著名的开源SQL引擎Presto生态，并持续在融合场景查询、跨数据中心/云、数据源扩展、性能、可靠性、安全性等方面发展，让数据治理、使用更简单。2．【新特性】Flink作业支持1.7/1.10多版本新上线Flink多版本能力，用户在提交作业时可以选择使用Flink1.7或者1.10版本，丰...

JIMHUA

发表于2020-12-02 11:06:37

8478 0 0

8.4k 0 0

服务功能更新1.【新功能】支持交互式分析能力基于openLooKeng引擎，推出交互式查询能力，兼容业界著名的开源SQL引擎Presto生态，并持续在融合场景查询、跨数据中心/云、数据源扩展、性能、可靠性、安全性等方面发展，让数据治理、使用更简单。2．【新特性】Flink作业支持1.7/1.10多版本新上线Flink多版本能力，用户在提交作业时可以选择使用Flink1.7或者1.10版本，丰...

数据湖探索 DLI 智能数据 EI企业智能