- 对数据湖探索(DLI)服务,用户日常大部分时间会使用SQL对数据进行分析处理,但是在某些时候处理的逻辑特别复杂,无法通过SQL处理,可以写Spark作业进行分析处理。本文描述通过一个例子演示如何在服务湖工厂(DLF)上提交一个Spark作业。 对数据湖探索(DLI)服务,用户日常大部分时间会使用SQL对数据进行分析处理,但是在某些时候处理的逻辑特别复杂,无法通过SQL处理,可以写Spark作业进行分析处理。本文描述通过一个例子演示如何在服务湖工厂(DLF)上提交一个Spark作业。
- 如果你已经申请MRS、DLI、DWS等大数据产品,接下来的时间里,你会希望将在大数据服务上快速运行业务,数据湖工厂(DLF)是一个在线一站式大数据开发平台,协助用户业务快速上云。本文利用数据湖工厂(DLF)、数据湖探索(DLI)对电影评分原始数据进行分析,输出评分最高和最活跃TOP 20电影。通过本文可以学习到DLF脚本编辑、作业编辑、作业调度等功能,以及DLI的SQL基本语法。 如果你已经申请MRS、DLI、DWS等大数据产品,接下来的时间里,你会希望将在大数据服务上快速运行业务,数据湖工厂(DLF)是一个在线一站式大数据开发平台,协助用户业务快速上云。本文利用数据湖工厂(DLF)、数据湖探索(DLI)对电影评分原始数据进行分析,输出评分最高和最活跃TOP 20电影。通过本文可以学习到DLF脚本编辑、作业编辑、作业调度等功能,以及DLI的SQL基本语法。
- 本文利用数据湖工厂(DLF)、数据湖探索(DLI)对电影评分、打标签全量原始数据和每日增量数据进行分析,输出评分最高TOP100电影和TOP 10热门标签。重点介绍DLF脚本编辑、作业编辑、作业调度等功能。 本文利用数据湖工厂(DLF)、数据湖探索(DLI)对电影评分、打标签全量原始数据和每日增量数据进行分析,输出评分最高TOP100电影和TOP 10热门标签。重点介绍DLF脚本编辑、作业编辑、作业调度等功能。
推荐直播
-
HDC深度解读系列 - Serverless与MCP融合创新,构建AI应用全新智能中枢
2025/08/20 周三 16:30-18:00
张昆鹏 HCDG北京核心组代表
HDC2025期间,华为云展示了Serverless与MCP融合创新的解决方案,本期访谈直播,由华为云开发者专家(HCDE)兼华为云开发者社区组织HCDG北京核心组代表张鹏先生主持,华为云PaaS服务产品部 Serverless总监Ewen为大家深度解读华为云Serverless与MCP如何融合构建AI应用全新智能中枢
去报名 -
苏州工业园区“华为云杯”2025人工智能应用创新大赛赛中直播
2025/08/21 周四 16:00-17:00
Vz 华为云AIoT技术布道师
本期直播将与您一起探讨如何基于华为云IoT平台全场景云服务,结合AI、鸿蒙、大数据等技术,打造有创新性,有竞争力的方案和产品。
即将直播
热门标签