- 对数据湖探索(DLI)服务,用户日常大部分时间会使用SQL对数据进行分析处理,但是在某些时候处理的逻辑特别复杂,无法通过SQL处理,可以写Spark作业进行分析处理。本文描述通过一个例子演示如何在服务湖工厂(DLF)上提交一个Spark作业。 对数据湖探索(DLI)服务,用户日常大部分时间会使用SQL对数据进行分析处理,但是在某些时候处理的逻辑特别复杂,无法通过SQL处理,可以写Spark作业进行分析处理。本文描述通过一个例子演示如何在服务湖工厂(DLF)上提交一个Spark作业。
- 如果你已经申请MRS、DLI、DWS等大数据产品,接下来的时间里,你会希望将在大数据服务上快速运行业务,数据湖工厂(DLF)是一个在线一站式大数据开发平台,协助用户业务快速上云。本文利用数据湖工厂(DLF)、数据湖探索(DLI)对电影评分原始数据进行分析,输出评分最高和最活跃TOP 20电影。通过本文可以学习到DLF脚本编辑、作业编辑、作业调度等功能,以及DLI的SQL基本语法。 如果你已经申请MRS、DLI、DWS等大数据产品,接下来的时间里,你会希望将在大数据服务上快速运行业务,数据湖工厂(DLF)是一个在线一站式大数据开发平台,协助用户业务快速上云。本文利用数据湖工厂(DLF)、数据湖探索(DLI)对电影评分原始数据进行分析,输出评分最高和最活跃TOP 20电影。通过本文可以学习到DLF脚本编辑、作业编辑、作业调度等功能,以及DLI的SQL基本语法。
- 本文利用数据湖工厂(DLF)、数据湖探索(DLI)对电影评分、打标签全量原始数据和每日增量数据进行分析,输出评分最高TOP100电影和TOP 10热门标签。重点介绍DLF脚本编辑、作业编辑、作业调度等功能。 本文利用数据湖工厂(DLF)、数据湖探索(DLI)对电影评分、打标签全量原始数据和每日增量数据进行分析,输出评分最高TOP100电影和TOP 10热门标签。重点介绍DLF脚本编辑、作业编辑、作业调度等功能。
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢
2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
回顾中 -
关于RISC-V生态发展的思考
2025/09/02 周二 17:00-18:00
中国科学院计算技术研究所副所长包云岗教授
中科院包云岗老师将在本次直播中,探讨处理器生态的关键要素及其联系,分享过去几年推动RISC-V生态建设实践过程中的经验与教训。
回顾中 -
一键搞定华为云万级资源,3步轻松管理企业成本
2025/09/09 周二 15:00-16:00
阿言 华为云交易产品经理
本直播重点介绍如何一键续费万级资源,3步轻松管理成本,帮助提升日常管理效率!
回顾中
热门标签