数据湖探索 DLI_标签_开发者

博客(117)
视频(2)
论坛(0)
云声(31)
代码示例(4)

华为云云原生数据湖助力梦饷集团洞察新电商机遇
互联网浪潮下，新电商、游戏等企业迎来了新一轮市场竞争，许多电商企业每天都在思考该如何更好地利用手中的数据，为现有客户提供“更贴身”服务、洞察新业务、挖掘更多潜在消费者、拓展新市场。如何面对业务飞速增长的挑战一直专注于应用的电商企业，在面对如何构建数字化能力所需要的ICT基础设施和服务时，面临着选择：是该自己投入高研发成本呢？还是选择市场领先的产品呢？梦饷集团也曾面临这样的挑战，作为新电商基础...

数据湖爱好者
发表于2021-04-26 15:44:56
9125 1 0

9.1k 1 0

互联网浪潮下，新电商、游戏等企业迎来了新一轮市场竞争，许多电商企业每天都在思考该如何更好地利用手中的数据，为现有客户提供“更贴身”服务、洞察新业务、挖掘更多潜在消费者、拓展新市场。如何面对业务飞速增长的挑战一直专注于应用的电商企业，在面对如何构建数字化能力所需要的ICT基础设施和服务时，面临着选择：是该自己投入高研发成本呢？还是选择市场领先的产品呢？梦饷集团也曾面临这样的挑战，作为新电商基础...
EI企业智能云原生大数据数据湖探索 DLI 自建电商
DLI Flink作业生产环境推荐配置指导
DLI Flink作业要如何配置才能稳定可靠，安心上生产环境呢？

Yunz Bao
发表于2021-04-23 11:57:33
8391 0 0

8.3k 0 0

DLI Flink作业要如何配置才能稳定可靠，安心上生产环境呢？
Flink 数据湖探索 DLI
【数据湖探索】FLINK 自定义jar作业配置checkppoint功能
## Flink 自定义作业配置checkppoint功能在Flink 自定义作业 Jar包代码中加入如下代码：如下代码含义是以EXACTLY_ONCE模式，每隔40s 保存checkpoint 到obs的${bucket}桶中的jobs/checkpoint/my_jar路径。其中最主要是的保存checkpoint路径，一般是将checkpoint存入obs桶中，路径格式如下：...

芳萌萌芳
发表于2020-12-31 10:40:29
10019 0 0

10.0k 0 0

## Flink 自定义作业配置checkppoint功能在Flink 自定义作业 Jar包代码中加入如下代码：如下代码含义是以EXACTLY_ONCE模式，每隔40s 保存checkpoint 到obs的${bucket}桶中的jobs/checkpoint/my_jar路径。其中最主要是的保存checkpoint路径，一般是将checkpoint存入obs桶中，路径格式如下：...
JAR 数据湖探索 DLI
基于多用户共享的Spark集群弹性扩缩容
DLI数据湖探索服务通过动态资源分配的开启、以及多用户共享default集群弹性扩缩容使用，在充分使用计算资源的基础上，节省了用户的成本。同时，对于用户按需专属队列，DLI已经支持用户指定扩缩容计划的定时扩缩容。用户根据自己的业务繁忙周期，制定自己所需的队列扩缩容计划，定时预置满足业务所需的计算资源，同时节省了成本。

霞光
发表于2020-12-28 23:32:32
12555 0 1

12.5k 0 1

DLI数据湖探索服务通过动态资源分配的开启、以及多用户共享default集群弹性扩缩容使用，在充分使用计算资源的基础上，节省了用户的成本。同时，对于用户按需专属队列，DLI已经支持用户指定扩缩容计划的定时扩缩容。用户根据自己的业务繁忙周期，制定自己所需的队列扩缩容计划，定时预置满足业务所需的计算资源，同时节省了成本。
spark 数据湖探索 DLI EI企业智能智能数据
DLI flink在边缘流计算上的实践（三）
本文中我们将介绍DLI 边缘Flink的实现原理，完全基于华为云公开资料阐述，实现细节作相应屏蔽。

Yunz Bao
发表于2020-12-28 17:01:25
13483 0 0

13.4k 0 0

本文中我们将介绍DLI 边缘Flink的实现原理，完全基于华为云公开资料阐述，实现细节作相应屏蔽。
数据湖探索 DLI 智能边缘平台 IEF
JAVA异常的处理注意点
Java异常处理的场景非常普遍，好的处理方式不仅可以提升代码可读性，还能帮助问题定位，接口调用更方便等等

jping
发表于2020-12-28 11:54:55
13927 0 0

13.9k 0 0

Java异常处理的场景非常普遍，好的处理方式不仅可以提升代码可读性，还能帮助问题定位，接口调用更方便等等
EI企业智能数据湖探索 DLI
Orca: A Modular Query Optimizer Architecture for Big Data
一个通用，可拓展，多核，高性能大数据优化器GPDB采用了shared-nothing的多处理架构，每个处理器拥有自己的内存，操作系统和磁盘等。主节点（master）管理其他的数据库实例（segment），数据在节点的分布可以是hashed，replicated，singleton等。ORCA基于Cascades优化流程（top-down)，并且可以作为其他存储系统的独立优化器模块；提供了一种...

hzjturbo
发表于2020-12-27 21:35:59
12231 0 0

12.2k 0 0

一个通用，可拓展，多核，高性能大数据优化器GPDB采用了shared-nothing的多处理架构，每个处理器拥有自己的内存，操作系统和磁盘等。主节点（master）管理其他的数据库实例（segment），数据在节点的分布可以是hashed，replicated，singleton等。ORCA基于Cascades优化流程（top-down)，并且可以作为其他存储系统的独立优化器模块；提供了一种...
数据湖探索 DLI 智能数据 EI企业智能
Flink SQL中的WindowOperator
在流处理的实际应用中，数据是连续不断的，因此我们不可能等待所有的数据都到了才开始处理。虽然我们可以对每来一条数据就处理一次，但是有一些场景我们需要使用一段时间内的数据进行计算，比如统计在一分钟内用户对某商品的浏览量，而这就是window窗口的使用场景。Flink sql中对于窗口的使用主要是通过TUMBLE、HOP和SESSION，而这些操作都是基于WindowOperato...

潇湘暮雨
发表于2020-12-27 20:24:16
9703 0 0

9.7k 0 0

在流处理的实际应用中，数据是连续不断的，因此我们不可能等待所有的数据都到了才开始处理。虽然我们可以对每来一条数据就处理一次，但是有一些场景我们需要使用一段时间内的数据进行计算，比如统计在一分钟内用户对某商品的浏览量，而这就是window窗口的使用场景。Flink sql中对于窗口的使用主要是通过TUMBLE、HOP和SESSION，而这些操作都是基于WindowOperato...
智能数据 EI企业智能数据湖探索 DLI
谈谈flink内存管理
Flink是jvm之上的大数据处理引擎，jvm存在java对象存储密度低、full gc时消耗性能，gc存在stw的问题，同时omm时会影响稳定性。同时针对频繁序列化和反序列化问题flink使用堆内堆外内存可以直接在一些场景下操作二进制数据，减少序列化反序列化的消耗。同时基于大数据流式处理的特点，flink定制了自己的一套序列化框架。flink也会基于cpu L1 L2 L3高速缓存的机制以及局

米兰的小铁匠
发表于2020-12-14 09:14:06
21896 0 0

21.8k 0 0

Flink是jvm之上的大数据处理引擎，jvm存在java对象存储密度低、full gc时消耗性能，gc存在stw的问题，同时omm时会影响稳定性。同时针对频繁序列化和反序列化问题flink使用堆内堆外内存可以直接在一些场景下操作二进制数据，减少序列化反序列化的消耗。同时基于大数据流式处理的特点，flink定制了自己的一套序列化框架。flink也会基于cpu L1 L2 L3高速缓存的机制以及局
数据湖探索 DLI 分布式
数据湖探索DLI 12月服务功能更新
服务功能更新1.【新功能】支持交互式分析能力基于openLooKeng引擎，推出交互式查询能力，兼容业界著名的开源SQL引擎Presto生态，并持续在融合场景查询、跨数据中心/云、数据源扩展、性能、可靠性、安全性等方面发展，让数据治理、使用更简单。2．【新特性】Flink作业支持1.7/1.10多版本新上线Flink多版本能力，用户在提交作业时可以选择使用Flink1.7或者1.10版本，丰...

JIMHUA
发表于2020-12-02 11:06:37
8380 0 0

8.3k 0 0

服务功能更新1.【新功能】支持交互式分析能力基于openLooKeng引擎，推出交互式查询能力，兼容业界著名的开源SQL引擎Presto生态，并持续在融合场景查询、跨数据中心/云、数据源扩展、性能、可靠性、安全性等方面发展，让数据治理、使用更简单。2．【新特性】Flink作业支持1.7/1.10多版本新上线Flink多版本能力，用户在提交作业时可以选择使用Flink1.7或者1.10版本，丰...
数据湖探索 DLI 智能数据 EI企业智能
Scala并发之Future、ExecutionContext
当我们需要同时执行多个任务、并且不会因为其中一个任务的执行时间漫长而陷入阻塞，就需要用到并发，也即多线程。Java中的并发实现主要在java.util.concurrent包中，Future这个概念其实Java里也有。Scala是在Java的基础上实现的函数式编程语言，所以Scala也可以调用Java API。今天会介绍Scala并发中应用比较多的两个概念——Future、ExecutionCon

我爱次火锅锅
发表于2020-12-01 09:18:49
14339 0 1

14.3k 0 1

当我们需要同时执行多个任务、并且不会因为其中一个任务的执行时间漫长而陷入阻塞，就需要用到并发，也即多线程。Java中的并发实现主要在java.util.concurrent包中，Future这个概念其实Java里也有。Scala是在Java的基础上实现的函数式编程语言，所以Scala也可以调用Java API。今天会介绍Scala并发中应用比较多的两个概念——Future、ExecutionCon
智能数据数据湖探索 DLI EI企业智能 HUAWEI CONNECT
如何在DLI中运行复杂PySpark程序
数据湖探索（DLI）服务是一站式的流处理、批处理分析的Serverless融合处理分析服务，对于PySpark是原生支持的，那么在DLI中我们如何更好的运行复杂PySpark程序呢？对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序我们通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Py...

Sephiroth
发表于2020-11-29 12:38:56
11083 0 0

11.0k 0 0

数据湖探索（DLI）服务是一站式的流处理、批处理分析的Serverless融合处理分析服务，对于PySpark是原生支持的，那么在DLI中我们如何更好的运行复杂PySpark程序呢？对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序我们通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Py...
EI企业智能数据湖探索 DLI
DLI flink在边缘流计算上的实践（二）
本文中我们将介绍DLI 边缘Flink的使用方法1. 前置动作创建华为云账户开通数据湖探索（DLI）服务开通智能边缘平台（IEF）服务注意：IEF服务必须具有Tenant Administrator权限才能运行边缘Flink作业。准备边缘节点，边缘节点需要满足一定的规格要求，具体请参见边缘节点规格要求。运行Flink作业，推荐规格不低于1核2GB内存。2. 边缘节点与Flink应用部署ste...

Yunz Bao
发表于2020-11-19 20:33:45
14600 0 0

14.6k 0 0

本文中我们将介绍DLI 边缘Flink的使用方法1. 前置动作创建华为云账户开通数据湖探索（DLI）服务开通智能边缘平台（IEF）服务注意：IEF服务必须具有Tenant Administrator权限才能运行边缘Flink作业。准备边缘节点，边缘节点需要满足一定的规格要求，具体请参见边缘节点规格要求。运行Flink作业，推荐规格不低于1核2GB内存。2. 边缘节点与Flink应用部署ste...
数据湖探索 DLI 智能边缘平台 IEF
【DLI运维宝典】通过DLI跨源写DWS表，非空字段出现空值异常
用户在DWS建业务表，然后在DLI创建跨源链接读写该表，某一天突然出现如下异常，报错信息显示DLI向该表某非空字段写入了空值，因为非空约束存在导致作业出错，但用户源数据不为空值，如何定位该问题？

Yunz Bao
发表于2020-11-17 20:35:14
11803 0 0

11.8k 0 0

用户在DWS建业务表，然后在DLI创建跨源链接读写该表，某一天突然出现如下异常，报错信息显示DLI向该表某非空字段写入了空值，因为非空约束存在导致作业出错，但用户源数据不为空值，如何定位该问题？
云数据仓库 GaussDB(DWS) 数据湖探索 DLI
【DLI运维宝典】用户使用datesource语法创建了OBS表，向OBS桶内导入数据后，执行查询操作查不到数据
用户使用datesource语法创建了OBS表，然后通过CDM或者其他手段向对应OBS路径下导入数据后，执行查询操作查不到数据，如何定位？

Yunz Bao
发表于2020-11-17 20:11:29
11651 0 0

11.6k 0 0

用户使用datesource语法创建了OBS表，然后通过CDM或者其他手段向对应OBS路径下导入数据后，执行查询操作查不到数据，如何定位？
数据湖探索 DLI

上滑加载中

推荐直播

码道新技能，AI 新生产力——从自动视频生成到开源项目解析
2026/04/08 周三 19:00-21:00

童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人

本次华为云码道 Skill 实战活动，聚焦两大 AI 开发场景：通过实战教学，带你打造 AI 编程自动生成视频 Skill，并实现对 GitHub 热门开源项目的智能知识抽取，手把手掌握 Skill 开发全流程，用 AI 提升研发效率与内容生产力。
回顾中
华为云码道：零代码股票智能决策平台全功能实战
2026/04/18 周六 10:00-12:00

秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家

利用Tushare接口获取实时行情数据，采用Transformer算法进行时序预测与涨跌分析，并集成DeepSeek API提供智能解读。同时，项目深度结合华为云CodeArts（码道）的代码智能体能力，实现代码一键推送至云端代码仓库，建立起高效、可协作的团队开发新范式。开发者可快速上手，从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中
华为云码道全新升级，多会话并行与多智能体协作
2026/05/08 周五 19:00-21:00

王一男-华为云码道产品专家；张嘉冉-华为云码道工程师；胡琦-华为云HCDE；程诗杰-华为云HCDG

华为云码道4月份版本全新升级，此次直播深度解读4月份产品特性，通过“特性解读+实操演示+实战案例+设计创新”的组合，全方位展现码道在多会话并行与多智能体协作方面的能力，赋能开发者提升效率
正在直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript