数据湖探索 DLI_标签_开发者

博客(117)
视频(2)
论坛(0)
云声(31)
代码示例(4)

DLI中Flink使用场景样例介绍（一）
该文章主要对DLI中Flink OpenSource SQL的使用场景样例进行介绍。

数据湖爱好者
发表于2021-05-08 11:38:26
8096 0 1

8.0k 0 1

该文章主要对DLI中Flink OpenSource SQL的使用场景样例进行介绍。
Flink SQL 大数据数据湖探索 DLI 智能数据
你的Parquet该升级了：IOException: totalValueCount == 0问题定位之旅
1. 问题描述使用Spark SQL进行ETL任务，在读取某张表的时候报错：“IOException: totalValueCount == 0”，但该表在写入时，并没有什么异常。2. 初步分析该表的结果是由两表join后生成。经分析，join的结果产生了数据倾斜，且倾斜key为null。Join后每个task写一个文件，所以partition key为null的那个task将大量的null...

数据湖爱好者
发表于2021-04-30 16:22:10
7072 2 0

7.0k 2 0

1. 问题描述使用Spark SQL进行ETL任务，在读取某张表的时候报错：“IOException: totalValueCount == 0”，但该表在写入时，并没有什么异常。2. 初步分析该表的结果是由两表join后生成。经分析，join的结果产生了数据倾斜，且倾斜key为null。Join后每个task写一个文件，所以partition key为null的那个task将大量的null...
大数据数据湖探索 DLI 智能数据
DWS对接DLI Flink实现实时数据接入
当前实时数据的接入和处理在DWS承载的业务中所占的比例越来越大，DWS可以和DLI Flink结合，实现实时数据处理结果的报表展示。同时，DWS可以作为Flink维表引擎，存储维表数据，共Flink关联时使用。下面介绍DWS如何与DLI Flink相结合，实现实时数据的存储和查询。一、创建DLI Flink作业在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Fli...

idle_in_transaction
发表于2021-04-30 15:09:15
9126 0 0

9.1k 0 0

当前实时数据的接入和处理在DWS承载的业务中所占的比例越来越大，DWS可以和DLI Flink结合，实现实时数据处理结果的报表展示。同时，DWS可以作为Flink维表引擎，存储维表数据，共Flink关联时使用。下面介绍DWS如何与DLI Flink相结合，实现实时数据的存储和查询。一、创建DLI Flink作业在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Fli...
EI企业智能 Flink 云数据仓库 GaussDB(DWS) 数据湖探索 DLI Gauss AP
Flink作业重启后，如何保证数据不丢失？
DLI Flink提供了完整可靠的Checkpoint/Savepoint机制，您可以利用该机制，保证在手动重启或者作业异常重启场景下，数据不丢失。

数据湖爱好者
发表于2021-04-28 09:32:36
10169 0 0

10.1k 0 0

DLI Flink提供了完整可靠的Checkpoint/Savepoint机制，您可以利用该机制，保证在手动重启或者作业异常重启场景下，数据不丢失。
Flink 数据湖探索 DLI
你的Parquet该升级了：IOException: totalValueCount == 0问题定位之旅
使用Spark SQL进行ETL任务，在读取某张表的时候报错：“IOException: totalValueCount == 0”，但该表在写入时，并没有什么异常。

wzhfy
发表于2021-03-29 20:35:36
12096 0 2

12.0k 0 2

使用Spark SQL进行ETL任务，在读取某张表的时候报错：“IOException: totalValueCount == 0”，但该表在写入时，并没有什么异常。
spark SQL 大数据数据湖探索 DLI
数据湖探索DLI“三箭齐发”，关于数据分析的这些技术你了解吗？
关于数据分析的这些技术你了解吗？

技术火炬手
发表于2020-10-30 14:41:33
6956 0 0

6.9k 0 0

关于数据分析的这些技术你了解吗？
数据湖探索 DLI
MySQL性能优化——执行计划分析
一、执行计划是什么，有什么作用SQL语句在数据库中，经过SQL解析器时，解析器会分析SQL语句，并根据索引等信息，制定数据查询的步骤顺序。我们可以通过在SQL语句前添加 EXPLAIN关键字来输出执行计划。通过分析执行计划，我们可以了解到：SQL的索引使用情况。连接查询的执行顺序。查询扫描的数据函数。二、SQL执行顺序分析在了解执行计划之前，首先要清楚数据库SQL的执行顺序。SQL书写顺序：...

数据湖爱好者
发表于2021-05-20 10:36:36
11041 0 1

11.0k 0 1

一、执行计划是什么，有什么作用SQL语句在数据库中，经过SQL解析器时，解析器会分析SQL语句，并根据索引等信息，制定数据查询的步骤顺序。我们可以通过在SQL语句前添加 EXPLAIN关键字来输出执行计划。通过分析执行计划，我们可以了解到：SQL的索引使用情况。连接查询的执行顺序。查询扫描的数据函数。二、SQL执行顺序分析在了解执行计划之前，首先要清楚数据库SQL的执行顺序。SQL书写顺序：...
EI企业智能 MySQL SQL 数据湖探索 DLI 智能数据
如何避免Spark SQL做数据导入时产生大量小文件
01什么是小文件？生产上，我们往往将Spark SQL作为Hive的替代方案，来获得SQL on Hadoop更出色的性能。因此，本文所讲的是指存储于HDFS中小文件，即指文件的大小远小于HDFS上块（dfs.block.size）大小的文件。02小文件问题的影响一方面，大量的小文件会给Hadoop集群的扩展性和性能带来严重的影响。NameNode在内存中维护整个文件系统的元数据镜像，用户...

数据湖爱好者
发表于2021-05-13 15:40:29
14622 0 0

14.6k 0 0

01什么是小文件？生产上，我们往往将Spark SQL作为Hive的替代方案，来获得SQL on Hadoop更出色的性能。因此，本文所讲的是指存储于HDFS中小文件，即指文件的大小远小于HDFS上块（dfs.block.size）大小的文件。02小文件问题的影响一方面，大量的小文件会给Hadoop集群的扩展性和性能带来严重的影响。NameNode在内存中维护整个文件系统的元数据镜像，用户...
EI企业智能 Hadoop spark 数据湖探索 DLI 智能数据
Apache Doris + Iceberg 快速搭建指南｜Lakehouse 使用手册（三）
湖仓一体（Data Lakehouse）融合了数据仓库的高性能、实时性以及数据湖的低成本、灵活性等优势，能够更加便捷地满足各种数据处理分析的需求。Apache Doris 持续加深与数据湖的融合，已演进出一套成熟的湖仓一体解决方案。我们将通过一系列文章介绍 Apache Doris 与各类主流数据湖格式及存储系统的湖仓一体架构搭建指南，包括 Hudi、Paimon、Iceberg、OSS、D...

SelectDB技术团队
发表于2024-08-02 17:19:54
4308 0 0

4.3k 0 0

湖仓一体（Data Lakehouse）融合了数据仓库的高性能、实时性以及数据湖的低成本、灵活性等优势，能够更加便捷地满足各种数据处理分析的需求。Apache Doris 持续加深与数据湖的融合，已演进出一套成熟的湖仓一体解决方案。我们将通过一系列文章介绍 Apache Doris 与各类主流数据湖格式及存储系统的湖仓一体架构搭建指南，包括 Hudi、Paimon、Iceberg、OSS、D...
数据分析数据处理数据库数据湖数据湖探索 DLI
大数据解决方案FAQ-华为云大数据主要计算服务对比(MRS、DLI、DWS、CSS)
　MRSDLIDWSCSS简述半托管式Hadoop全家桶，包含hadoop core、hive、spark、flink、kafka、hbase等主要hadoop生态组件。Hadoop生态Serverless化批(Spark)/流(Flink)/交互式(Presto)融合的云原生大数据处理分析服务。高性能关系型分布式数据仓库。基于开源ES自研改进的搜索服务对标服务/产品A1EMRAthena/...

服务伙伴知识管理社区
发表于2024-05-15 15:54:24
9029 0 0

9.0k 0 0

　MRSDLIDWSCSS简述半托管式Hadoop全家桶，包含hadoop core、hive、spark、flink、kafka、hbase等主要hadoop生态组件。Hadoop生态Serverless化批(Spark)/流(Flink)/交互式(Presto)融合的云原生大数据处理分析服务。高性能关系型分布式数据仓库。基于开源ES自研改进的搜索服务对标服务/产品A1EMRAthena/...
MapReduce 大数据数据湖探索 DLI
数据湖（一）：数据湖概念
数据湖概念一、什么是数据湖数据湖是一个集中式的存储库，允许你以任意规模存储多个来源、所有结构化和非结构化数据，可以按照原样存储数据，无需对数据进行结构化处理，并运行不同类型的分析对数据进行加工，例如：大数据处理、实时分析、机器学习，以指导做出更好地决策。二、大数据为什么需要数据湖当前基于Hive的离线数据仓库已经非常成熟，在传统的离线数据仓库中对记录级别的数据进行更新是非常麻烦的，需要对待...

Lansonli
发表于2022-05-29 16:31:14
7109 0 3

7.1k 0 3

数据湖概念一、什么是数据湖数据湖是一个集中式的存储库，允许你以任意规模存储多个来源、所有结构化和非结构化数据，可以按照原样存储数据，无需对数据进行结构化处理，并运行不同类型的分析对数据进行加工，例如：大数据处理、实时分析、机器学习，以指导做出更好地决策。二、大数据为什么需要数据湖当前基于Hive的离线数据仓库已经非常成熟，在传统的离线数据仓库中对记录级别的数据进行更新是非常麻烦的，需要对待...
Kafka 大数据数据湖探索 DLI
hive语法创建分区表，方便CDM做增量导出
背景：数据湖里面建表，可以使用DataSource语法或Hive语法，两种建表语法创建的OBS表（即外表）在运行job时，在分区表下的文件夹路径会有所不同，DataSource语法创建的OBS分区表路径生成无规律，不利于CDM做数据的增量导出。

roger_0936
发表于2022-03-28 19:09:15
10090 0 0

10.0k 0 0

背景：数据湖里面建表，可以使用DataSource语法或Hive语法，两种建表语法创建的OBS表（即外表）在运行job时，在分区表下的文件夹路径会有所不同，DataSource语法创建的OBS分区表路径生成无规律，不利于CDM做数据的增量导出。
Hive spark 云数据迁移 CDM 数据湖探索 DLI
华为云DLI SQL作业初体验丨【我的华为云体验之旅】
本案例是《大数据全栈成长计划-第二期》的一个实操任务，本实验通过使用DLI SQL作业，体验会SQL就会大数据分析。一、实验目的1、快速熟悉华为云大数据serverless服务DLI。2、掌握使用DLI创建表、读写表。二、实验步骤如下 1、领取免费试用《数据湖探索服务DLI》（1）前往活动页领取DLI免费实验资源：https://activity.huaweicloud.cn/Date...

lwq1228
发表于2021-12-28 12:01:02
11847 0 0

11.8k 0 0

本案例是《大数据全栈成长计划-第二期》的一个实操任务，本实验通过使用DLI SQL作业，体验会SQL就会大数据分析。一、实验目的1、快速熟悉华为云大数据serverless服务DLI。2、掌握使用DLI创建表、读写表。二、实验步骤如下 1、领取免费试用《数据湖探索服务DLI》（1）前往活动页领取DLI免费实验资源：https://activity.huaweicloud.cn/Date...
SQL 数据湖探索 DLI
基于华为云DLI运行Spark作业
概述数据湖探索（Data Lake Insight，简称DLI）是完全兼容Apache Spark、Apache Flink、openLooKeng（基于Apache Presto）生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需要管理任何服务器，即开即用。支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格...

lyssg
发表于2021-11-08 16:08:08
9894 0 0

9.8k 0 0

概述数据湖探索（Data Lake Insight，简称DLI）是完全兼容Apache Spark、Apache Flink、openLooKeng（基于Apache Presto）生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需要管理任何服务器，即开即用。支持标准SQL/Spark SQL/Flink SQL，支持多种接入方式，并兼容主流数据格...
数据湖探索 DLI
DLI Flink OpenSource SQL中用户自定义sink的使用
在DLI的Flink OpenSource SQL语句中针对用户不同的使用场景，为用户提供了较多的connector以供用户使用，如DWS connector、kafka connector、RDS connector、Hbase connector和elasticsearch connector等。虽然这些connector足够应付大多数主流使用场景，但是仍然有可能不能够满...

潇湘暮雨
发表于2021-09-30 09:05:56
10284 0 0

10.2k 0 0

在DLI的Flink OpenSource SQL语句中针对用户不同的使用场景，为用户提供了较多的connector以供用户使用，如DWS connector、kafka connector、RDS connector、Hbase connector和elasticsearch connector等。虽然这些connector足够应付大多数主流使用场景，但是仍然有可能不能够满...
EI企业智能数据湖探索 DLI 智能数据

上滑加载中

推荐直播

码道新技能，AI 新生产力——从自动视频生成到开源项目解析
2026/04/08 周三 19:00-21:00

童得力-华为云开发者生态运营总监/何文强-无人机企业AI提效负责人

本次华为云码道 Skill 实战活动，聚焦两大 AI 开发场景：通过实战教学，带你打造 AI 编程自动生成视频 Skill，并实现对 GitHub 热门开源项目的智能知识抽取，手把手掌握 Skill 开发全流程，用 AI 提升研发效率与内容生产力。
回顾中
华为云码道：零代码股票智能决策平台全功能实战
2026/04/18 周六 10:00-12:00

秦拳德-中软国际教育卓越研究院研究员、华为云金牌讲师、云原生技术专家

利用Tushare接口获取实时行情数据，采用Transformer算法进行时序预测与涨跌分析，并集成DeepSeek API提供智能解读。同时，项目深度结合华为云CodeArts（码道）的代码智能体能力，实现代码一键推送至云端代码仓库，建立起高效、可协作的团队开发新范式。开发者可快速上手，从零打造功能完整的个股筛选、智能分析与风险管控产品。
回顾中
华为云码道全新升级，多会话并行与多智能体协作
2026/05/08 周五 19:00-21:00

王一男-华为云码道产品专家；张嘉冉-华为云码道工程师；胡琦-华为云HCDE；程诗杰-华为云HCDG

华为云码道4月份版本全新升级，此次直播深度解读4月份产品特性，通过“特性解读+实操演示+实战案例+设计创新”的组合，全方位展现码道在多会话并行与多智能体协作方面的能力，赋能开发者提升效率
正在直播

热门标签

Java Python 数据结构数据库 Linux 机器学习网络任务调度 MySQL JavaScript